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Отредактировал и опубликовал на сайте 


Прошло более 20 лет со времени первого издания книги. К ней все чаще 
обращаются психологи при научных исследованиях. На нее ссылаются 
в публикациях. Студенты и аспиранты, слушатели спецфакультетов по 
психологии, молодые ученые и практики используют ее как учебное и 
справочное пособие. Все это потребовало переиздания книги, которая 
первоначально вышла сравнительно небольшим тиражом. 

За прошедшие годы некоторые положения книги, на мой взгляд, оказа- 
лись излишними для психологической практики либо устаревшими. В 
новом издании они переработаны. Значительно переработаны первая 
глава — расширены сведения о преобразованиях и последовательностях 
событий, а также отдельные параграфы второй, третьей и четвертой глав, 
в которых изложение и расчеты распределений вероятностей теперь вы- 
полнены на мультимножествах и матрицах, а скалярные соотношения те- 
ории вероятностей заменены матричными уравнениями распределений. 
Во второй главе, помимо небольших купюр и редакционных поправок, 
устаревший метод нормализации распределений по составу заменен ме- 
тодом нормализации функции распределения. В третью главу добавлен 
материал о совокупных характеристиках положения, рассеивания и связи 
случайных величин Ho расчетах этих характеристик. В пятой главе пред- 
ложены новые подходы к разработке моделей сложных совокупностей и 
проектированию экономичных по объему репрезентативных выборок на 
основе этих моделей. В шестой главе к рассмотрению методов дисперси- 
онного анализа добавлен параграф по основам математического планиро- 
вания эксперимента. Полностью переделано Приложение | — читателю 
предлагаются новые полезные сведения о матрицах и действиях с ними. 
Сокращен и обновлен список рекомендуемой литературы. Кроме того, 
исправлено большое количество опечаток, обнаруженных студентами, за 
что я им весьма признателен. В целом концепция, структура и основное 
содержание книги сохранены. 

В последнее время стало принято отсылать читалеля к пакетам при- 
кладных программ для обработки эмпирических данных на ЭВМ. При 
значительных массивах данных это, конечно, целесообразно. Однако 
опыт показывает, что для правильной интерпретации результатов ком- 
пьютерной обработки и прежде всего для того чтобы верно спланировать 
эксперимент и получить необходимые данные, исследователю надо пони- 
мать существо математико-статистических методов, а это невозможно, 
если они не освоены путем расчетов вручную на несложных примерах. 
На такое освоение и нацелен настоящий учебник. 


Светлой памяти 
Бориса Герасимовича Ананьева 
посвящаю 


Предисловие к первому изданию 


Математическая статистика —это наука о случайных явлениях. Под 
явлением понимается любой подлежащий изучению объект независимо 
от его коккретного содержания. По степени количественной определен- 
ности явления рассматриваются как отдельные события, величины, функ- 
ции и как системы событий, величин, функций. Если изучаемые объекты 
можно трактовать как следствия многочисленных разнообразных по дей- 
ствию причин, то интересующие исследователя свойства этих объектов 
определяются неоднозначно и могут быть предсказаны лишь в резуль- 
‘rave массовых наблюдений не полностью, а с большей или меньшей ве- 
роятностью. Такие объекты и характеризуются как случайные явления 
(случайные события, величины, функции или их системы). 

Математическая статистика занимается малематическим описанием 
случайных явлений, т.е. построением вероятностных моделей, а также 
проверкой их пригодности. Поэтому выделяют два раздела: описатель- 
ную статистику и статистику «проверяющую» (статистическую проверку 
оответственно разделяется и методический аппарат. Понятия 
и методы описательной статистики создаются в теории вероятностей, а 
понятия и методы статистической проверки гипотез создаются в специ- 
альных теориях (например, в теории статистических решений) либо в 
приложениях теории вероятностей к конкретным наукам. 

Современное развитие обширного комплекса наук о человеке" предпо- 
лагает широкое использование методов математической статистики уже 


“Ананьев Б.Г. Человек как предмет познания. Л., 1968. 
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потому, что именно в этих науках объекты исследования в наибольшей 
мере удовлетворяют понятию случайных явлений. Благодаря огромной 
структурной и функциональной сложности психические, социальные, пе- 
дагогические и т.п. явления издавна служили развитию самой математи- 
ческой статистики (здесь достаточно упомянуть Ф. Гальтона, развившего 
первокачальные идеи корреляции и регрессии, Ч. Спирмена, создавше- 
го ранговую корреляцию и однофакторный анализ, Л.Терстоуна, раз- 
работавшего мультифакторный анализ). Однако к настоящему времени 
собственный понятийный и методический аппарат математической ста- 
тистики значительно развился и усложнился, что, естественно, вызывает 
трудности его использования в «не математизированных» еще науках. 


Примеры зарубежных руководств по предмету, собственный опыт ав- 
тора и его коллег убедительно свидетельствуют о необходимости спе- 
циальной интерпретации основных идей, понятий и методов математиче- 
ской статистики для специалистов психологических и смежных с ними 
дисциплин. В этой связи, очевидно, изложение основ математической 
статистики не может и не должно быть отягошено необходимыми для ма- 
тематика, но излишними ддя психолога математическими подробностя- 
ми. Учитывая сказанное, автор ставил перед собой следующие задачи: 
1) дать минимум языка (основные понятия и символы), необходимый и до- 
статочный для подготовки экспериментального исследования, первичной 
и последующей специальной обработки полученных данных, углубленно- 
го изучения специальной литературы; 2) ознакомить (в общем виде и на 
примерах из области психологии, педагогики, социологии ит.д.) с систе- 
мой идей и вероятностных методов, которые целесообразно использовать 
в комплексе психологических дисциплин; 3) показать на конкретных при- 
мерах из разных областей психологии пути и способы применения тех 
методов теоретико-вероятностного описания и проверки статистических 
гипотез, которые не требуют использования электронных вычислитель- 
ных машин. В этой связи книга имеет ряд особенностей 


В изложении автор основывался на системном подходе, естественном 
для познания психических, социальных, педагогических и т.п. явлений, в 
котором существенное значение имеют уровни квантификации изучаемых 
объектов, а также последовательный переход от номинативной квантифи- 
кации свойств (события) ких упорядочиванию и ранжированию, и затем к 
уравниванию интервалов и отношений (величины, функции). Изложение 
приближено к задачам психологической теории и практики и везде пояс- 
няется примерами, большинство которых взято из конкретных исследо- 
ваний автора и его коллег. Для работы над книгой читателю достаточно 
математической подготовки в объеме средней школы. Изложение ведется 
без доказательств, а вся необходимая терминология и символика из выс- 
шей математики вводится по мере надобности. Необходимые сведения о 
матрицах и действиях с ними даны в Приложении | (к нему следует обра- 


титься при первой же встрече с понятием матрицы). Существенное вни- 
мание уделено специальным понятиям и терминам из теории вероятности 
и других разделов математической статистики. Автор глубоко убежден, 
что робость перед математическими методами и трудности в их усвое- 
кии и использовании обусловлены «языковыми» трудностями. Поэтому, 
подчеркивая термины, рекомендуемые к употреблению, автор стремился 
приводить также синонимы, встречающиеся в специальной литературе. 
Библиография использованных математических источников приведена в 
конце книги, ссылки в тексте сделаны на работы нематемалического ха- 
рактера. Автор старался представить широкий арсенал возможностей и 
методических средств математической статистики в психологических и 
смежных дисциплинах, особое внимание обращая на методы, важные для 
этих наук, но мало освещенные в литературе, достуиной широкому кру- 
ry исследователей. Тем не менее отбор материала в книгу, видимо, не 
лишен определенного субъективизма. 

Автор считает своим приятным долгом выразить признательность 
профессору Б.Ф. Ломову, который предложил ему разработать и читать 
на факультете психологии курс лекций по математической статистике, 
профессору Б.Г.Ананьеву, который способствовал развитию изысканий 
автора на этом пути и благодаря поддержке которого была создана эта 
книга, а также всем преподавателям и сотрудникам факультета лсихоло- 
гии, помогавшим ему советами и материалами. 


ГЛАВА |. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ СОБЫТИЙ 
А. СОБЫТИЕ И МЕРЫ ВОЗМОЖНОСТИ ЕГО ПОЯВЛЕНИЯ 


1.1.1, Понятие о событии 


Событием называют всякий реальный или воображаемый факт, 
который интересует исследователя. О событии говорят, что оно 
появляется, наступает, происходит, имеет место и т.п. Наблю- 
дение или эксперимент, в котором могут появляться какие-либо 
события, называется опытом. Существующие объективно или 
специально вызываемые события, известные экспериментатору и 
влияющие на ход опыта, называются условиями (опыта). Так как 
условия могут быть очень многочисленными, то обычно из их чи- 
сла выделяют небольшую группу основных условий, влияние ко- 
торых на ход опыта наиболее существенно. В отдельных случаях 
в качестве основных принимаются условия, которые по каким-то 
соображениям наиболее желательны для целей исследования. Со- 
бытия, которые объективно влияют на ход опыта, но о которых 
экспериментатору ничего не известно, в число условий опыта не 
включаются. События, которые при данных условиях могут про- 
изойти в опыте, называются исгодами (опыта). Условия опыта 
вместе с совокупностью возможных исходов называются испыта- 
нием. 

Пример 1.1. Опыт состоит в наблюдении за учеником, решаю- 
щим задачи. Условиями опыта являются: возраст и уровень обра- 
зования ученика, место и время наблюдения, характер задачи (по 
виду учебной дисциплины) и тип задачи (по виду решающего пра- 
вила), время, отпущенное на решение, и т.п. В зависимости от 
‘целей наблюдения за основные условия может быть принята лю- 
бая часть или все перечисленные условия. Как правило, многие из 
событий, способных влиять на исходы опыта, не могут быть вклю- 
чены в круг условий. Например, наличие у ученика определенных 
побуждений неучебного характера, безусловно, влияет на TO, как 
он решает задачу. Но, будучи скрытыми от наблюдателя, эти по- 
буждения вне специального эксперимента не могут учитываться в 
качестве условий опыт: 
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При решении конкретной задачи можно выделить два или три 
исхода. Два исхода: первый — ученик решает задачу правильно, 
второй— ученик не решает задачу. Второй исход, в свою оче- 
редь, может быть подразделен на два новых исхода: ученик ре- 
шает задачу неправильно, и ученик не доводит решение до кон- 
ца и отказывается от дальнейших попыток, потому что не знает, 
что делаль. Таким образом, в случае трех исходов выделяются: 
первый — ученик находит правильное решение и решает задачу 
до конца, второй — ученик неправильно решает задачу до конца. 
и третий — ученик не решает задачу до конца. Попытки решить 
одну задачу при перечисленных условиях, приводящие к одному 
‘из указанных исходов, образуют одно испытание, попытки решить 
вторую задачу — второе испытание и т. д. 


|.1.2. Случайные и неслучайные события 


Случайным называется событие, которое при определенном ком- 
плексе условий опыта в каждом конкретном испытании может про- 
исходить, а может и не происходить. Так, в примере 1.1 уче- 
ник может решить предложенную задачу правильно, а может и 
не решить. Поэтому факт правильного решения задачи учени- 
ком можно рассматривать как случайное событие. Аналогично 
и противоположный факт — неправильное решение задачи — тоже 
случайное событие. Достоверным называется событие, которое 
всегда имеет место при определенном комплексе условий. Напри- 
мер, нормально развивающийся ребенок всегда начинает говорить 
на языке тех людей, с которыми общается в период освоения уст- 
ной речи. Невозможным называется событие, которое никогда 
не происходит при определенном комплексе условий. Например, 
животное, лишенное человеческого мозга. и артикуляторных орга- 
нов, не может пользоваться человеческой речью, Достоверные и 
невозможные события объединяются понятием неслучайных собы- 
тий. 

Большинство фактов психической жизни человека и животных 
можно рассматривать как случайные события. Трудно назвать 
какое-либо психическое явление, которое наступало бы во всех 
случаях, когда имеются соответствующие условия. Всегда, есть 
исключения: рождаются дети с одной рукой или двумя головами; 
наряду с нормальными появляются дебилы, имбецилы и идиоты, 
с одной стороны, талантливые и гениальные —с другой; как бы 
внимательно ни следил наблюдатель за интересующим его объ- 
ектом, внимание может быть отвлечено каким-либо посторонним 
раздражителем. Примеры можно легко умножить, но здесь мы 
ограничимся сказанным. 


Важно отметить, что под категорию случайных теоретически 
подпадают все события, которые хотя бы однажды не появляются 
тогда, когда они должны были появиться, несмотря на то, что пре- 
жде они появлялись всегда. Но практически такие события прини- 
мают за достоверные. Аналогичное утверждение можно сделать 
и в отношении невозможных событий. Поэтому нет, в сущности, 
четких границ между достоверными и случайными событиями, а 
также между случайными и невозможными событиями. После то- 
го как мы рассмотрим понятие о вероятности, еще раз обратимся 
к разделению достоверных, случайных и невозможных событий. 


1.1.1, Частота частость и вероятность 


Каждый знает по личному опыту, что одни случайные события 
происходят сравнительно часто, а другие— редко. Например, в 
Санкт-Петербурге часто идет дождь, а вот жара в 30° бывает ред- 
ко. Гриппом мы болеем часто, а психическими заболеваниями 
сравнительно редко. Слова «часто», «редко» наряду с другими 
отображают в языке ожидаемую степень возможности появления 
случайных событий в окружающей нас действительности. Но воз- 
никает вопрос об объективной мере возможности появления слу- 
чайных событий. В качестве такой меры могут использовалься 
частота, частость и вероятность события. 

Частотой события называется количество случаев появления 
события. Пусть в примере 1.1 ученик правильно решил восемь 
задач. Это и есть частота правильного решения задачи учени- 
ком. Легко видеть, что частота зависит от количества испыта- 
ний. Тот же ученик из пяти задач мог решить, например, четыре, 
а из 20-16. Ясно, что при большом количестве наблюдений одно и 
то же случайное событие будет встречаться чаще. Частота может 
служить в качестве сравнительной оценки возможности появления 
случайных событий лишь при условии одинакового числа испыта- 
ний. Если же это условие не выполняется, то нужна другая мера. 
Такой мерой возможности появления случайных событий служит 
частость. 

Частость — это относительная частота, т.е, частота, деленная 
на количество испытаний. Обозначая частоту f, количество ис- 
пытаний п, а частость р, можем записать 

_f 

=F (1.1) 
Частость в гораздо меньшей степени зависит от количества испы- 
таний, чем частота. Tak, если ученик из пяти задач правильно ре- 
шил четыре, из десяти — восемь, а из 20 только 16, то частость во 
всех трех случаях будет одинакова: 4/5. Тем не менее и частость 
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не является наилучшей мерой возможности появления случайного 
события. Покажем это на примере. 

Пример 1.2. В ряде случаев важно знать, какова возможность 
спонтанного воспроизведения памятью человека хорошо извест- 
ных ему образов. Например, как часто среди произвольно назы- 
ваемых или записываемых арабских цифр появляется определен- 
ная цифра? Был организован несложный эксперимент, в котором 
испытуемому предлагалось записывать цифры от «0» до «9» в лю- 
бом порядке, кроме прямого и обратного, и таким путем заполнить 
цифрами стандартный лист писчей бумаги. Рассмотрим в данном 
примере частость записи цифры «7» одним из испытуемых. 


200 400 600 00 1000 1200 


Puc. 1.1. Рассеивание значений частости цифры «7 по груп- 
пам из пятидесяти исходо 
По оси ординат — частости, по оси абсцисс — количество ис- 
ния 


ходов; 4 характеризует величину рассеи: 


Всего испытуемый записал более 1300 цифр, относительно ко- 
торых частость записи цифры «7» составляет 0,108. Вычислим 
значения этой частости для каждых пятидесяти цифр, записанных 
испытуемым: для первых пятидесяти, для вторых пятидесяти, для 
третьих пятидесяти и т. д. Результаты приведены на рис. 1.1, отку- 
да видно, что значения частости изменяются случайным образом 
в пределах от 0,04 до 0,16. Пределы изменения частости, обо- 
значенные на рис. 1.1 буквой 4, характеризуют рассеивание зна- 
чений частости, определяемых по группам из пятидесяти испы- 
таний. Поступая аналогичным образом, мы определили частости 
цифры «7» за каждые 10, 50, 200, 400, 600 и 650 цифр, записанных 
испытуемым, и нашли величины 4. На рис. 1.2 можно видеть, что 
рассеивание значений частости цифры 47» не остается постоян- 
ным, а быстро уменьшается при увеличении количества исходов, 
на основе которого вычислялись частости. 

Таким образом, частость события тоже зависит от количества, 
испытаний. Но чем больше испытаний проведено, тем больше мы 
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Рис. 1.8. Уменьшение величины pacce- 


ивания значений частости цифры «7°в Qt 
зависимости от количества исходов. 
По оси ординат — величина рассеива- р 


ния, по оси абсцисс — количество иско- 0 
pers 1050100 20 «400 — 600 650 


‘можем быть уверены в TOM, что значение частости отображает 
объективную возможность появления интересующего нас собы- 
тия, а ие обусловлено количеством испытаний. Полностью, одна- 
ко, избавиться от влияния числа испытаний, пользуясь частостью, 
нельзя. Необходима другая мера. Такой мерой объективной воз- 
можности появления события является вероятность. 


Ид, Статистическое определение вероятности 


Существует немало определений того, что такое вероятность. 
Здесь мы рассмотрим одно из наиболее распространенных. Оно 
предложено Р.Мизесом и обычно называется «статистическим» 
определением вероятности. Как видно из примера 1.2, при увели- 
чении количества испытаний значения частости изменяются все 
меньше и меньше, приближаясь к некоторому постоянному значе- 
нию. Обозначив это значение P, можем записать 


P= ви. (1.2) 
noon 
Постоянное значение, к которому как к своему пределу стремится 
частость при неограниченном увеличении количества испытаний, 
и называют вероятностью. 

На практике, очевидно, невозможно увеличивать количество ис- 
пытаний до бесконечности. Поэтому непосредственно из опыта 
определить значение вероятности событий нельзя. В отдельных 
случаях, при определенных условиях, можно априори найти значе- 
ние вероятности. Это так называемое классическое определение 
вероятности. Примерами такого определения являются вероят- 
ности выпадения «орлах или «решки» при бросании монеты пра- 
вильной формы, равные 1/2 каждая, или вероятности выпадения 
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любой из сторон игральной кости (кубика), имеющей правильную 
форму, соответственно равные 1/6 (по числу сторон). В большин- 
стве практических приложений все же приходится пользоваться 
частостями как оценками вероятностей, определяемыми в длин- 
ных сериях испытаний*. 

Как следует из уравнений (1.1) и (1.2), и частость, и вероят- 
ность численно могут принимать любое значение между нулем и 
единицей. Действительно, если f = п, то P = 1, и событие, о кото- 
ром идет речь, является достоверным. Если же f = 0, о Р=0, и 
событие является невозможным. Теоретически частость и вероят- 
ность сколь угодно мало могут отличалься от нуля или единицы, 
но практически результаты округляются. Например, P = 0,999 
округляется до Р=1, аР = 0,001 —до Р = 0. Поэтому, как ука- 
зывалось выше, «граница» между случайными и неслучайными 
событиями весьма условна. Очень частые случайные события на 
практике могут быть приняты за достоверные, а очень редкие— 
за невозможные события. Таким образом, вероятность как мера 
возможности появления события характеризует количественно и 
случайные, и неслучайные события. Согласно терминологии, ре- 
комендованной к использованию в научной литературе Комите- 
том научно-технической терминологии, вероятность — это «поло- 
жительное число, не превышающее единицу, представляющее со- 
бой количественную меру возможности появления случайного со- 
бытия в повторяющихся от опыта к опыту основных условиях. .. 
Она определяет среднюю частость, с которой можно ожидать по- 
явления случайного события в длинных сериях независимых ис- 
пытаний»**. 


| 1.5, Геометрическое определение вероятности 


Каждому числу может быть однозначно сопоставлен отрезок 
прямой линии, часть плоскости или некоторый объем — рис. 1.3 
(вместо квадратиков можно было бы взять любые другие фигуры, 
а вместо кубов — другие тела, лишь бы площади (или объемы) 
соотносились пропорционально числам). Пусть теперь имеется 
некоторая вероятность P, выражаемая через среднюю частость: 
Р=Ё, где f и п— какие-то числа, например f=1, п=2. Тогда, co- 
гласно рис. 1.3, сопоставляя этим числам какие-либо геометриче- 
ские фигуры, мы можем выразить нашу вероятность как отноше- 
ние двух площадей плоских фигур (51 и 52), либо как отношение 
двух длин отрезков (L; и L2), либо как отношение двух объемов 


*Вопрос о точности таких оценок рассматривается в главе 5. 
**Надежностьтехнических систем и изданий. Основные понятия. Тер- 
минология. Вып. 67а. M., 1965. С. 22. 
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Puc. 1.5. Сопоставление числам геометрических фигур: от- 
резнов (2), плоскостей (6), объемов (0). 


некоторых тел (У, # V2), т.е. как отношение, имеющее заданную ве- 
личину 1/2. Если отношение имеет другую величину, то мы соот- 
ветствующим образом выбираем длины, площади, объемы. Итак, 
геометрически вероятность представляет собой отношение длин, 
площадей и объемов (в общем случае — гиперобъемов)*. Геоме- 
трическая интерпретация вероятности позволяет наглядно изо- 
бражать вероятностные соотношения между событиями (чем все- 
гда пользуются) и облегчает решение некоторых практических за- 
дач. 

Пример 1.3. Одной из важных задач человека-опералора явля- 
ется контроль за показаниями приборов, предполагающий опозна- 
ние цифр и условных знаков на лицевых частях приборов. Пусть 
произошло отклонение одного из контролируемых параметров, 
что выразилось в изменении показаний соответствующего прибо- 
ра, расположенного на приборной панели перед оператором. До- 
пустим, что человекв 100% случаев правильно опознает изменение 
показаний прибора, если он смотрит на этот прибор. Тогда воз- 
никает вопрос, какова вероятность события A, состоящего в том, 
что человек-опералор посмотрит на прибор, расположенный сре- 
ди других на приборной панели? 

Эту вероятность можно определить геометрически как отноше- 
ние площади, занимаемой прибором, к общей площади панели. 
Однако приборы разных типов имеют разную площадь лицевой 
части. Кроме того, известно, что человек правильно опознает 
объекты, попадающие в определенную область поля зрения, пло- 
щадь которой больше площади лицевой части обычного стрелоч- 
ного прибора. Поэтому определим искомую вероятность как от- 


‘AGeprays Г.Г. Тронь А.П., Копенкин Ю.Н., Коровина И.А. 
Справочник по зероятностным расчетам. М., 1970. С.28. 
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Pee. 1.4. Оптимальные угловые раз- 
меры приборной панели, град. (по: 
Пахомов, Измаильцев, 1963). 


ношение площади области поля зрения, соответствующей 100%-му 
опознанию, к площади приборной панели. 

Экспериментально установлено, что область поля зрения чело- 
века, соответствующая 100%-му опознанию объектов, находящих- 
ся в этой области, простирается в любом направлении от цен- 
тра фиксации глаз на 10 град*, т.е. эту область можно по форме 
считать плоским кругом с площадью 51 = яЕ?, где м = 3,14 и 
Е = 10 град. Следовательно, 51 = 314 град. Далее эксперимен- 
тально показано, что существуют оптимальные (с точки зрения 
контроля) размеры приборной панели (рис. 1.4)**. Обозначим 
площадь панели 5, тогда (по рис. 1.4} эта площадь составляет: 
5. =2.68.(78+45) = 16728 град***. Полагая, что зрение операто- 
ра одинаково часто фиксирует любую часть площади приборной 
панели, вычислим интересующую нас вероятность события А (со- 
стоящего в том, что человек-оператор посмотрит на прибор, рас- 
положенный на панели) как отношение площади области 100%-го 
опознания к площади приборной панели: 


5: _ 314 _ 
P(A) = 3, = тотов = 8,019. 


*Гипенрейтер Ю.Б. Опыт экспериментального исследования рабо- 
ты зрительной системы наблюдателя // Инженерная психология/ Под ред, 
А.Н. Леонтьева. M., 1964. С. 223. 

+ Пахомов А.Ф., Измаильцев А.М. Экспериментальные исследова- 
ния по рациональному размещению индикаторных устройств в поле зре- 
пия оперьтор» // Проблемы общей и индустривльной психологии /Под ред. 
Б.Г. Ананьева и Б.Ф. Ломова. Л., 1963. — Перевод линейных размеров, при- 
веденных этими авторами, в угловые осуществлялся нами по формуле а = 
тот тв» где а — линейные размеры сторон панели, мм; 4— дистьиция нь- 
блюдения, мм; а— угловые размеры, град. Результаты нами округлены (с 
недостатком) до целых. 

**" Размеры площадей 51 и 52 при определенной дистанции наблюдения 
можно вычислить по формуле 51 = 5; -0,00039d?, где 4— дистанция наблю- 
дения; при этом наименование «градус в квадрате» опускается. 


1.1, СИСТЕМА СЛУЧАЙНЫХ СОБЫТИЙ 


111. Понятие о системе событий 


Системой событий будем называль совокупность событий, рас- 
сматриваемых вместе. События в системе приобретают свойства, 
которых они, если их рассматривать по отдельности, не имеют. 
Так, события в системе могут происходить совместно или не со- 
вместно. Они могут зависеть друг от друга. Одно событие может 
быть представлено в виде определенной группы других событий. 
События в системе могут быть по-разному упорядочены в некото- 
ром пространстве. Все эти свойства имеют важное значение для 
практики. 


| 1.1. Совместное появление событий 


Все события в некоторой системе событий можно разделить на 
две группы в зависимости от того, могут они или не могут по- 
являться вместе в одном испытании. Одну группу составляют 
события, которые никогда не могут появиться вместе в одном и 
том же испытании. Если появляется одно из них, то все другие 
уже исключены. Такие события называются несовместными (не- 
совместимыми). Лругую группу образуют события, которые мо- 
гут появиться вместе в одном и том же испытании, но могут и 
не появиться вместе. Такие события будем называль совместны- 
ми (совместимыми). Совместные события, рассматриваемые по 
отдельности, целесообразно называть изолированными (отделен- 
ными), а рассматриваемые вместе — совмещенными. 

Пример 1.4. Опыт состоит в проверке восприятия испытуе- 
мым знаков, предъявляемых тахистоскопически. Условия опыта 
подразделяются на три группы: условия, характеризующие ис- 
пытуемого; условия, характеризующие аппаратуру и процедуру 
опыта; условия, характеризующие предъявляемые знаки. Напри- 
мер, условия, характеризующие знаки, — это количество знаков в 
алфавите, угловые размеры, вид и степень контраста контура зна- 
ка с фоном, наличие характерных деталей, степень соответствия 
абриса знака изображаемому объекту и т. д. В качестве основных 
условий в конкретном исследовании выбираются любые комбина- 
ции возможных условий. Испытанием является предъявление од- 
Horo знака и возможные ответы испытуемого, которые образуют 
исходы опыта. 

В данном примере можно выделить следующие исходы: пер- 
вый — испытуемый правильно называет (или записывает) предъяв- 
ляемый знак, второй — испытуемый неправильно называет его, 
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третий — испытуемый по каким-либо причинам не дает ответа. 
При необходимости можно детализировать второй исход. В част- 
ности, испытуемый может: а) неправильно принять предъявляе- 
мый знак за другой знак из того же алфавита, например, предъ- 
является цифра «7», а испытуемый называет пифру «1»; 6) не- 
правильно принять предъявляемый знак за другой знак из иного 
алфавита, например, предъявлялась цифра «5%, а испытуемый в 
ответ назвал букву «Б». Возможна и дальнейшая детализация 
каждого из новых исходов второго исхода. Неправильно назы- 
ваемые знаки обычно имеют сходство с предъявляемыми. Если 
можно точно условиться о том, в чем это сходство состоит, то 
все неправильно называемые знаки можно разделить на группы 
по степени сходства с предъявляемым знаком, например на две— 
сходных и несходных. “Таким образом, второй исход детализи- 
руется по крайней мере на четыре новых исхода. Перечисленные 
исходы изображены на рис. 1.5 в виде дерева (или графа) событий. 


1. Знак назван 2. Знак назвам $. Ислытуемый 
НЫ, СЫ воокикивю 
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знак из другого алфавита знак us това же алфавита 
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8, Меправиль- 
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‘wax из това 
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и ш ту 


Puc. 1.5. Дерево событий (врабские цифры) и исходов (рим- 
ские цифры) к примеру 1.4. 


Все исходы опыта в примере 1.4 — это события несовместные. 
Действительно, если знак назван правильно (исход 1), то осталь- 
ные исходы невозможны уже в данном испытании. А вот события 
2, 4, 6— это совместные события. Потому что если назван знак из 
другого алфавита, то он назван неправильно. При этом ничто не 
мешает неправильно названному знаку иметь большое сходство с 
предъявленным. Мало того, именно большое сходство со знаком 
из другого алфавита может явиться одной из причин неправиль- 
ного называния предъявленного знака. Точно так же совместны 
следующие тройки событий: 2, 4, 7; 2, 5, 8 из, 5, 9. 

Система несовместных событий, представляющих собой исхо- 
ды опыта, называется полной группой событий. Поскольку коли- 
чество исходов, выделяемых в опыте, зависит от обстоятельств, 
понятие полной группы событий условно. В общем случае число 
исходов может быть бесконечно велико, как мы покажем в следу- 
ющЩей главе. Только в немногих частных случаях имеется неболь- 
шое количество заранее известных исходов, образующих полную 
группу событий. Например, при бросании монеты — два, при бро- 
сании игральной кости— шесть, при назывании первой пришед- 
шей на ум арабской цифры — десять, а при назывании русской 
буквы — тридцать три. Несмотря на условность, понятие полной 
группы событий очень важно для правильного вычисления веро- 
ятностей, поэтому рекомендуется по возможности заранее перечи- 
слить все несовместимые события, образующие полную группу. 


|1]. Зависимость между событиями 


Появление одних событий в системе может оказывать влияние 
на возможность появления других событий в той же или в дру- 
гой системе. События называются зависимыми, если появление 
одного из них влияет на возможность появления другого. Если 
появление одного события не влияет на возможность появления 
другого события, то эти события называют независимыми. За- 
висимость между событиями в системах может быть обоюдная 
или односторонняя, парная или множественная. Чаще всего в тео- 
рии вероятностей рассматривается обоюдная зависимость между 
событиями, при этом считается, что если событие А зависит от 
события В, то и событие В зависит от А. В этом смысле, на- 
пример, несовместные события — всегда зависимые события, так 
как, по определению, появление одного из них делает невозмож- 
ным появление всех других. Но существует и односторонняя зави- 
симость, например между «видовыми» и «родовыми» событиями; 
если идет дождь (событие В), то на небе обязательно есть облака 


(событие А) — событие В зависит ра-собызия Ano we наоборот. 
ль 


так как если на небе облака, то дождь может и не идти. Облака и 
дождь — события совместные и зависимые. Но совместные собы- 
тия могут быть как зависимыми, так и независимыми. Например, 
движения двух автомашин по улицам города — чаще всего собы- 
тия независимые, но машины могут столкнуться на перекрестке, 
а одновременные появления двух машин в одном месте перекрест- 
ка — события совместные. 

Зависимость между совместными событиями может быть не не- 
посредственной, а опосредствованной некоторым явлением, вы- 
ступающим в качестве их общей причины. Анализ таких при- 
чин, как и вообще содержательный анализ явлений, находится 
вне компетенции статистики. Статистика формализует причинно- 
следственные отношения между природными явлениями, лишь кон- 
статируя факты влияния одних событий на возможность появле- 
ния других, а содержательная интерпретация этих фактов — зада- 
ча специальных научных дисциплин. 


Отредактировал и опубликовал на сайте © 35S S o/s 


1.1 4. Преобразования событий 


С помощью преобразований событий (систем событий), т.е. за- 
мены одних другими по определенным правилам, выявляются и 
‘фиксируются отношения между событиями, события усложняют- 
ся либо упрощаются. Важнейшие отношения между событиями — 
это отрицание, импликация, тождество, различие или сходство, 
простота или сложность событий. 

Отрицание (дополнение) события А — это все другие события, 
совокупность которых обозначается А и читается «не А» 
(рис. 1.6, а). Например, если А — событие, состоящее в том, что 
испытуемыми должны быть трудоспособные мужчины, то его от- 
рицание А — это любые другие возможные испытуемые. События 
Aw A противоположны по смыслу отображаемых реалий и по- 
этому называются противоположными событиями; они образуют 
элементарную полную группу событий как несовместные и зави- 
симые: по закону исключенного третьего классической логики не- 
появление одного из них в ходе опыта должно однозначно обусло- 
вливать появление другого («либо А, либо не А»). На практике 
многие свойства изучаемых явлений и сущностей континуальны, 
поэтому от исследователя требуется осторожность, четкость в со- 
держательной интерпретации противоположных событий. 

Имптликация двух событий (A, В) может означать причинно- 
следственное отношение, логическое либо временнбе следование, 
отношение целого и части. Эти отношения обозначаются четырь- 
мя равносильными способами: А + В, В -—А, АВ, ВСАи 


Рис. 1.6. Преобразования событий (графическая интерпрета- 
ция нь диаграммах Вени»), 

«— утверждение и ero отрицание, 6— импликация, в — тож- 
дество, #— обобщение, д— прямая сумма, с — объединение, 
ж— пересечение, J— логическая разность 


читаются «из А следует В», «В после А», «А включает в себя В» 
ит. п. (рис. 1.6, 6). Например, привлечение мужчин в качестве ис- 
пытуемых (событие А) влечет за собой привлечение трудоспособ- 
ных мужчин (событие В С А) наряду с мальчиками и стариками 
(событие В С A) 

Тождество событий А, В определяется как их взаимовключен- 
ность: если А > В и одновременно В 2 А, то события тождествен- 
ны (равны, равносильны, эквивалентны); это обозначается пятью 
способами: А = В, А = В, А 2 В, А -- В, А <> В и читается co- 
ответственно: «А тождественно Вх, «А равно (равносильно) В», 
«А эквивалентно В» (=, ~ и < — символы эквивалентности) — 
рис. 1.6, в. При содержательной интерпретации тождеству собы- 
THA соответствуют синонимии и тавтологии. Например, эквива- 
лентны события, интерпретируемые применительно к конкретной 
личности как тревожность, нейротизм, высокая вероятность лож- 
ных тревог. 

Различие или crodcmeo событий определяется степенью их от- 
личия от тождества; при малом отличии говорят о сходстве, а при 
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большом— о различии. Так как объективных критериев отличия 
малого от большого для континуально интерпретируемых собы- 
тий не существует, то применяют соглашения типа «на пятипро- 
центном уровне значимости сходство неслучайно». Для дискрет- 
ных множеств событий, очевидно, неопределенность отсутствует, 
потому что мерой различия-сходства может служить относитель- 
ное число одинаковых признаков у сравниваемых событий. На- 
пример, если как события интерпретируются предъявляемые Ha 
короткое время тахистоскопически буквы В, И, Н, состоящие из 
одинакового числа элементов, то у И и Н одинаковы 2/3 элемен- 
тов, ау НиВ, Ии В— всего лишь 1/3 элементов, т.е. в пер- 
вом случае больше сходства, а во втором— различия. Поэтому 
испытуемые в экспериментах чаще путают И и Н между собой, 
чем с В. 

Простота или сложность событий определяется количеством 
символов, обозначающих события, а не особенностями их содер- 
жательной интерпретации, которая сама по себе может быть про- 
стой либо сложной. В примерах 1.1 и 1.4 мы видели, что одно собы- 
тие может быть детализировано на два и более событий. События, 
которые с помощью определенных операций могут быть предста- 
влены в виде комбинации других событий, называются сложными 
событиями. Те события, из комбинации которых образовано слож- 
ное событие, называются простыми событиями. Простые собы- 
тия, выбранные в качестве исходных элементов для построения си- 
стемы сложных событий, называются элементарными событиями. 
Простота и сложность соотносительны: чаще всего простые со- 
бытия можно детализироваль на еще более простые, а сложные — 
использовать для конструирования более сложных событий. Где 
остановиться в этом упрощении и усложнении событий, зависит 
от цели исследования, от желаемой полноты описания изучаемых 
объектов, от количества испытаний, в которых можно наблюдать 
события, и от многих других обстоятельств. 

Формальные операции, посредством которых усложняются, 
упрощаются и эквивалентно записываются события (системы со- 
бытий), разнообразны. Необходимый для психологической прак- 
тики набор операций составляют: совмещение, обусловливание, 
обобщение, суммирование (простое, прямое, логическое) и раз- 
вертывание — как операции усложнения, синтеза событий; свертьу; 
вание, логическое умножение и вычитание — как операции упро- 
щения, анализа событий; наконец, перестраивание и в том числе 
перестановка рядов и транспонирование — как операции эквива- 
лентной записи, изменяющие пространственную структуру, но со- 
храняющие состав сложных событий и систем событий. 

Совмещение применяется к изолированным совместимым собы- 


тиям, системам событий для синтеза из них совмещенных собы- 
qua и систем. Если A, В— изолированные совместимые собы- 
тия, то их совмещение А х В = АВ— совмещенное событие*. На- 
пример, если А означает мужчин, В— высокий рост, то AB— 
мужчины высокого роста. Если (А, А), (В, В) — изолированные, 
но совместимые системы (полные группы) событий, то их совме- 
щение (А, A) x (В, В) = (AB, AB, AB, АВ) — это новая полная груп- 
па совмещенных событий, совмещенная система событий. Напри- 
мер, если А —интроверсия, А— экстраверсия, В— низкий, В— 
высокий нейротизм по Г.Айзенку, то АВ следует интерпрети- 
ровать как малотревожных интровертов, АВ — как интровертов- 
нейротиков, АВ— как малотревожных экстравертов и АВ— как 
экстравертов-нейротиков. 

Обусловливание применяется для синтеза условных событий, си- 
стем событий из безусловных событий и систем. События, системы 
можно изучать без выделения или с выделением особых условий. 
При этом говорят о безусловных либо условных событиях, систе- 
мах. Выделение определенного условия — тоже событие, причем 
совместимое с обусловливаемым событием. Поэтому в любой па- 
pe совместимых событий A, В можно предполагать взаимное об- 
условливание и определять два условных события: АХ В = А/В 


и ВХА = В/А, которые читаются: «А при условии В» и «В 
при условии A»**. Интерпретация условных событий при опре- 
деленном навыке не затруднительна: если А — мужской пол, B— 
высокий рост, то А/В означает лиц мужского пола из числа вы- 
сокорослых, а В/А — высокорослых из числа лиц мужского пола, 
причем для зависимых событий эти числа разные. Пусть (А, А), 
(В, В) — две системы событий, интерпретируемые по Г. Айзенку. 
Из этих безусловных систем можно взаимным обусловливанием 
получить четыре условные системы (системы условных событий): 
(А, A) %(B,B) = (А, А)/В,(А,А)/В] = (А/В, А/В), (А/В, А/В), 
а таюже (В, В) (А.А) = (В, В)/А, (В, В)/А] = (ВИА, B/A), (B/A, 
B/A)]. Интерпретировать первые ape из них следует как возмож- 
ную обусловленность интро—экстравертированности людей низ- 
ким либо высоким нейротизмом. Интерпретироваль две осталь- 
ные системы предлагается читателю. Надо отметить, что при об- 
условливании нескольких совместимых событий количество воз- 


“Операция основана на дехартовом умножении множеств (см. Приложе- 
ние 1), поетому результат совмещения АВ— это декартово произведение 
элементов A, В. 

**Обусловливание основывается на декартовом делении — операции, об- 
ратной декартову умножению (см. Приложение 1). 
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можных условных событий быстро увеличивается. Например, 
для трех событий (A,B,C) обусловливанием можно получить не 
только шесть простых условных событий — по два для каждой па- 
ры совместных событий: А/В, B/A, A/C, C/A, B/C, C/B, но и 
шесть сложных: А/ВС, В/АС, С/АВ, АВ/С, АС/В, ВС/А. Учи- 
тывая многомерность психологических объектов, читателю полез- 
но самостоятельно рассмотреть возможные результаты совмеще- 
ний и обусловливаний для четырех и более событий— А, В, С, Д; 
А, В, С, Д, Е ит. д. 

Обобщение* позволяет определять частоты тождественных со- 
бытий и эмпирические распределения частот в системах событий, 
наблюдаемых от опыта копыту. Например, если при первом и вто- 
ром наблюдениях произошло событие A, т.е. получены (A), (A), 
то, обобщая их, имеем 


(А)0 (А) = (А) + (A) = (A, A) = (2А). (1.3) 


Для конечного числа п таких наблюдений можем записать 
n 


(А). =А0АО...ОА= (nA), 

f=1 нее ан 

где: = 1,2 п — номера наблюдений, (nA) — элементарное муль- 
тимножество** в свернутом виде, п— хратность, интерпрети- 
руемая как частота события А (рис. 1.6, г). Конкретный пример. 
Четырем студентам предложено решить задачи A,B,C. Первый 
студент смог решить задачи А и С, второй —А и В, третий — 
лишь задачу А, четвертый — В. Здесь имеется четыре множества 
решенных задач: (A,C), (A,B), (А), (В), обобщая которые, полу- 
чаем мультимножество, интерпретируемое как распределение ча- 
стот решенных задач: 


(A, C)0(A, B)0(A) 0(B) = (3A, 2B, C). 


Заметим, что частота, равная единице, в данном случае не пишет- 
ся, но она пишется при обычной группировке событий (табл. 1.1). 
Еще пример. Обследованы три группы людей: первая— трое 
мужчин, две женщины трудоспособного возраста и один ребенок; 


*Эть операция, предложенная нами, впервые представлень в книге: Ме- 
тодология исследований по психологии труда и инженерной психологии/ 
Под ред. А.А.Крылова. Ч. I. Л., 1974. С.60. 

**Мультимножество—ето множество, которое в явном виде содержит 
тождественные элементы. Обычное множество нетождественных элемен- 
тов — частный случай мультимножества. Мультимножества приводятся в 
книге: Рейнгольд Э., Нивергельт Ю., Jeo Н. Комбинаторные anro- 
ритмы. Теория и практика/ Пер. с англ. М., 1980. С.72.— Заметим, что 
синтезировать мультимножество из обычных множеств можно только опе- 
рацией «обобщение». 


вторая— три женщины, три ребенка и один старик; третья — трое 
мужчин и два старика. Записывая и обобщая соответствующие 
мультимножества, получаем общее распределение частот обсле- 
дованных людей: (3m, 2x, р) 0 (3ж, 3p, с) 0 (3m, 2с) = (6м, 5ж, 
4p, 3c). Частными случаями обобщения, связанными с опреде- 
ленными ограничениями, являются простое, прямое и логическое 
суммирования. 

Простое суммирование применяется лишь к тождественным по 
элементам множествам событий; при этом суммируются частоты, 
кратности тождественных событий. Элементарный пример демон- 
стрировала формула (1.3). Лругой пример. В психологическую 
консультацию в первый день обратились трое мужчин и две жен- 
щины, а во второй— двое мужчин и пять женщин. Записывая в 
обозначениях и суммируя мультимножества, получаем общее рас- 
пределение мужчин и женщин, обратившихся за помощью к пси- 
хологу: (3m, Эж) + (2m, 5ж) = (5м, Tax). 

Прямое суммирование применяется к множествам и мульти- 
множествам, не имеющим тождественных элементов (рис. 1.6, д). 
Например, если сначала психологом обследовались трое муж- 
чин и две женщины трудоспособного возраста, а потом — еще че- 
тыре школьника и пять пенсионеров, то всего обследовано (3M, 
2ж) @ (4ш, 5п) = (3м, 2ж, 4ш, 5п), т.е. 14 человек. 

Логическое суммирование (объединение, дизъюнкция) применя- 
ется только к обычным, не имеющим тождественных элементов, 
множествам, сумму здесь образуют лишь различные события из 
имеющихся в слагаемых (рис. 1.6, е). Вместо формулы (1.3) приме- 
няется формула. 

(A) 9 (А) = (А), 


и из мультимножеслв предыдущих примеров получаются обыч- 
ные множества, так как частота событий не отражается: (3M, 2%) 
U (2m, 5ж) = (м, ж); (3м, 2%) U (4ш, 5п) = (м, ж, ш, п). По этой 
причине объединение в приложениях теории вероятностей факти- 
чески используется лишь для выявления номенклатуры, т.е. пол- 
ного (применительно к определенной цели) перечня событий. На- 
пример, объединяя результаты решения задач четырьмя студен- 
тами из табл. 1.1, получаем номенклатуру предъявленных задач: 
(A,C)U (A, В) U (А) Ц (В) = (А,В, С). 

Развертывание применяется для детализации, уточнения зна- 
НИЙ, конкретизации понятий, их признаков и связанных с ни- 
ми событий. При этом исходные события заменяются полны- 
ми группами более конкретных событий. Пусть, например, П— 
множество признаков пола людей. Привычно выделять в нем два. 
противоположных пола— мужской и женский, т.е. П -* (м, ж) = 
(м,м) = (Ж,ж). Однако биологически существуют гермафро- 
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Таблица 1.1 
Обычная группировка событий с подсчетом частот 


Задачи 
Чьстоть 
предложены решены студентами решений 
т п Ш ту 
А 1 1 & 3 
B 1 1 2 
С 1 1 


диты, а в психологии изучается континуум «мужественность — 
женственность», квантуя который определенным образом, можно 
получить конечное множество градаций, в частности: высокая, 
низкая мужественность, низкая, высокая женственность. Обозна- 
чив эти градации аббревиатурами из первых букв, можно после- 
довательно развернуть: П=(м, ж) — (вм, HM, нж, BK). Очевидно, 
развертывание здесь можно было бы продолжить. Покажем это 
на рассмотренном выше примере 1.4, где выделялись исходы опы- 
та с восприятием знаков. 

Первоначально среди исходов опыта выделяются два: И -— 
(0,5) — испытуемый не отвечает либо отвечает; это первая pax 
eepmxa, т.е. результат развертывания. Отвечая, испытуемый мо- 
жет давать верный ответ либо неверный ответ; соответственно 
этому выполняется второе развертывание: о — (во, Во); подста- 
вляя вторую развертку в первую, получаем: И -+ (5, во, Во). Да- 
лее, как было показано на рис. 1.5, исходами неверного ответа мо- 
гут быть знаки того же алфавита, что предъявлялся, либо не то- 
го, другого алфавита. Поэтому выполняется третье развертыва- 
ние: Bo — (Вот, Вот); подставляя этот результат в предыдущий, 
получаем: И -+ (5,0) + (5, во, Бо) — (5, во, Бот, вот). Но невер- 
ный ответ может быть обусловлен определенным сгодством или 
несгодством неверно воспринятого знака с предъявленным. Сле- 
довательно, необходимо четвертое развертывание: (Вот, Вот) > 
[Вот + (Ботс, Боте)] [Вот -+ (BoTc, Ботс)] = (Ботс, Bote, БоТс, Ботс), 
в результате которого каждый исходный элемент развернут на 
два более конкретных. Подставляя четвертую развертку в пре- 
дыдущую, окончательно получаем шесть выделенных в приме- 
ре 1.4 исходов: И - (5,0) — (5,во,Бо) — (5,во,Бот, вот) -» 
(5, во, Вотс, Bore, воТс, воте). 

Свертывание применяется для сокращения описаний; его ре- 


зультат — свертка — имеет смысл имени, кратко обозначающего 
первоначально развернутое описание. ‘Tak, например, говоря о 
мужественности или женственности, о женщинах либо мужчинах, 
мы имеем в виду половой диморфизм, или, еще короче, пол че- 
ловека. Очевидно, что свертывание противоположно разверты- 
ванию, но в общем они не являются взаимно обратимыми опера- 
циями: развертывание моделирует элементы процесса углубля- 
ющегося и расширяющегося познания, а свертывание — процессы 
экономизации описаний путем называния, ведь имя представля- 
ет собой краткое и обычно абстрактное обозначение предмета из 
определенного класса предметов. Но если однозначно зафиксиро- 
валь каждую пару сверток и разверток в качестве равносильных 
событий, систем событий, то свертывание и развертывание ста- 
новятся взаимно обратимыми операциями. Так, из предыдуще- 
го можно развернуть исходные понятия: «пусть исходами опыта 
будут ответ либо неответ испытуемого», т.е. И — (0,5); но 
можно, наоборот, свернуть: «обозначим ответ либо отсутствие 
ответа как исходы опыта», т.е, (0,5) — И. Если теперь объ- 
единить попарно тождественные элементы развертки и свертки: 
{(ИЧИ), (9 —), [(0,5) 0 (0,5]]} = И = (0,5), то окончательно 
получим эквивалентность обозначения И и обозначаемого (0,5), 
причем стрелками указаны направления развертывания и сверты- 
вания. Заменив стрелки на знак равенства, маскируем когнитив- 
ную противоположность развертывания и свертывания, но полу- 
чаем два общеизвестных взаимно перестановочных способа, запи- 
си: И = (0,5) и (9,5) =И 

Логическое умножение (конъюнкция, пересечение) применяется 
для выделения общей частн событий из конечного числа обычных 
множеств событий (рис. 1.6, ж). Например, общей задачей, решен- 
ной первым и вторым студентами (табл. 1.1), является (А, С) П 
(А,В) = А. Если в сомножителях нет общих элементов, то пе- 
ресечением будет пустое множество: (А)П (В) = 8, оно и означает 
отсутствие общих элементов. Заметим, что, применяя конъюнк- 
цию к мультимножествам, мы теряем кратности и получаем обыч- 
ное множество — общую часть номенклатур сомножителей (если 
она есть): (3м, 2ж) П (2м,5ж) = (м, ж), как и при объединении; но 
(Зм, 2ж) п (Аш, 5п) = 2. 

Вычитание применяется для выделения определенной части 
из множества событий и может рассматриваться как операция, 
обратная обобщению, простому, прямому и логическому сумми- 
рованию. Например, вычитая из обобщенного распределения ре- 
шенных студентами задач подмножество задач, решенных первым 
студентом (табл. 1.1), получаем распределение задач, решенных 
только остальными студентами: (ЗА,2В,С) - (А,С) = (2A,2B). 
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Аналогично, вычитая из простой суммы проконсультированных 
за два дня лиц, консультировавшихся во второй день, получаем 
распределение проконсультированных в первый день: (5M, 72K) — 
(2м,5ж) = (3м,2ж). Подобно и с прямой суммой, в частности: 
(3M, 2ж, Аш, 5m) — (4m, 5m) = (3m, 2ж). Так же, в сущности, вычи- 
таются и обычные множества, причем логическая разность А — В 
интерпретируется как запрет: «В запрещает А» (рис. 1.6, 3). 


Перестраивания используются для удобства сопоставления и 
сравнения, синтеза и анализа сложных событий, систем событий. 
Среди перестраиваний наиболее известны перестановка рядов и 
транспонирование. Перестановкой рядов единообразно упорядо- 
чиваются номенклатуры простых событий в сложных событиях, 
сложных событий в системах событий. Например, перечень ис- 
пытуемых перестановкой рядов можно упорядочить по алфави- 
ту: (С,Е, А, Л,В) + (A,B,C, Д,Б) или сгруппировать компактно 
женщин отдельно от мужчин: (м, 9K, м, ж,м) = (ж,ж;м, м,м). Ана- 
логично можно элементы мультимножества упорядочить по убы- 
ванию либо возрастанию кратностей (см. 1.3.2, рис. 1.8). С по- 
мощью транспонирования строки записываются как столбцы, а 
столбцы — как строки; например, если А = (B,C), то mpancno- 


нированное АТ = ый причем (Ат) = А. Заметим, что строч- 


ная запись системы событий экономит место, поэтому преобразо- 
вания событий стараются по возможности записывать в строку: 
Ax B= (А, А)х (В, В) = (AB, AB, АВ, АВ). Но при большом числе 
событий или систем-сомножителей совмешаемые события трудно 
‘удержать в памяти, не пропустив и не перепутав. Поэтому исполь- 
зуется запись в виде матрицы, строки и столбцы которой помечены 
обозначениями совмещаемых событий: 


вв 
ух вв = (AB is) (1.4) 


> >| 


A xB=( 


причем пометки строк соответствуют событиям первого, а помет- 
ки столбцов — второго сомножителя. Хотя совмещение переста- 
новочно, будем придерживалься последовательностей пометок в 
(1.4), так как с увеличением мерности совмещенных систем количе- 
ство эквивалентных вариантов их матричной записи быстро уве- 
личивается. Уже из трех групп противоположных событий раз- 
личными перестраиваниями можно получить 120 эквивалентных 


матриц совмещенных событий. Вот две из них: 


(1.5) 


Это трехмерные матрицы; кроме строк и столбцов в них имеются 
блоки столбцов, для удобства восприятия и понимания разделен- 
ные пунктиром. Эти блоки обозначены в (1.5) событиями из груп- 
пы С = (С,С). В случае четырехмерной матрицы понадобились бы 
еще блоки строк, пятимерной — блоки столбцов либо строк и т, д. 

Заканчивая, нужно отметить, что рассмотренные преобразова- 
ния в совокупности не исчерпывают способов анализа и синте- 
за событий, но позволяют, смотря по обстоятельствам, облегчить 
подготовку исследования, сбор, обработку и анализ статистиче- 
ских данных, упростить вычисление вероятностей сложных собы- 
THA, получение и применение эмпирических распределений веро- 
ятностей событий и величин. 


1.11. Уровни количественного определения событий 


Под количественным определением (квантификацией) события 
будем понимать его замену числами. Целью такой замены явля- 
ется возможность оперироваль числами вместо того, чтобы дей- 
ствовать с реальными вещами. Но операции с числами должны 
адекватно отображаль действия с вещами и обосновываться из- 
вестными нам свойствами самих вещей, иначе получатся фиктив- 
ные результаты. 

'Упрощенно подходя к задаче количественного определения не- 
которого реального явления, выделяют два традиционных уровня: 
уровень «словесного» качественного описания (события), уровень 
измерения (величины и функции). Но величины и функции тоже 
могут быть представлены как события. Поэтому здесь мы дадим 


*Bonpoc о количественном определении событий — сИециальный вопрос, 
выходящий за пределы нашей темы. Однако возможность применения кон- 
кретных статистических мер и методов зависит от уровня количественного 
определения изучаемых объектов. Поэтому мы коснемся этого вопрос». 
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несколько иную интерпретацию уровней количественного опреде- 
ления применительно к событиям. 

Первый уровень количественного определения события— это 
его словесное описание, в котором указаны общие и специфиче- 
ские свойства, характеризующие данное событие, но ничего не 
говорится (потому что обычно ничего не известно) о степени вы- 
раженности этих свойств. События, определенные на таком уров- 
He, будем называть классифицированными событиями. Типич- 
ный пример классифицированных событий — классический пере- 
чень темпераментов: сангвинический, холерический, флегматиче- 
ский и меланхолический. Или перечень свойств нервной систе- 
мы. Или алфавитный перечень букв и цифр. И так далее. Боль- 
шинство психических явлений находится сейчас в психологии на 
этом уровне определения. Может показаться странным, что мы 
называем этот уровень уровнем количественного определения. Но 
это вполне правомерно. Мы можем перенумероваль классифици- 
рованные события числами и затем пользоваться этими числами 
как «именами» событий, что короче, чем длинные словесные опи- 
сания. Правда, никаких привычных (в смысле обычной алгебры) 
операций с этими числами производить нельзя. Мы, далее, можем 
охарактеризовать классифицированные события вероятностными 
мерами и упорядочить их в соответствии с вероятностями появле- 
ния. Мы можем, наконец, определять степень зависимости между 
классифицированными событиями. 

Следующий, более высокий уровень количественного определе- 
ния — это словесное описание события, в котором, кроме выделе- 
ния общих и особых свойств, характеризующих событие, указана 
степень проявления этих свойств, но не указана (обычно не из- 
вестна) мера проявления. Так, например, сравнивая визуально 
длины двух отрезков, мы можем указаль, равны ли они, или одна 
больше или меньше другой. Но без привлечения общепринятых 
известных нам мер длины (метров, сантиметров и т.п.) мы не мо- 
жем сказать, насколько больше или насколько меньше. Несколько 
отрезков мы можем упорядочить по возрастанию длины: «боль- 
ше», «еще больше», «гораздо больше» и т.д.; или по убыванию 
длины: «меньше», «еще меньше», «гораздо меньше». Степень вы- 
раженности других свойств без указания меры передается слова- 
ми: «лучше— хуже», «дальше — ближе» и тому подобными при- 
лагательными в сравнительной степени. События, количественно 
определенные на данном уровне, будем называть упорядоченны- 
‚ми событиями. Поскольку упорядочение касается одного свой- 
ства, система упорядоченных событий образует ряд событий. В 
этом ряду события могут быть перенумерованы числами, величи- 
ны которых должны отображать отношения «больше — меньше», 


т.е. ряду событий, упорядоченных по возрастанию, должны со- 
поставляться числа, также упорядоченные по возрастанию, или 
наоборот. Эти числа можно суммировать и`умножать, но обычно 
считается, что их нельзя вычитать и делить*. 

Последний из выделяемых нами уровней количественного опре- 
деления событий — уровень измерения**. На этом уровне к сло- 
весному описанию предыдущего уровня добавляется указание, на- 
сколько больше или насколько меньше выражено конкретное свой- 
ство событий. Это указание может быть дано лишь посредством 
некоторой меры, что предполагает установление единицы измере- 
ния данного свойства. События, количественно определенные на. 
данном уровне, будем называть измеренными событиями. Этим 
событиям сопоставляются числа, определяемые в метрических си- 
стемах измерения, т.е. системе событий сопоставляется система 
чисел, полученных в результате измерения. Такая система чисел 
обычно называется величиной. Рассуждая в обратном порядке, 
получаем возможность рассматривать величину как систему со- 
бытий, каждое из которых — число. Для измеренных событий все 
операции с числами эквивалентны действиям с самими вещами, 
которые отображены в событиях. 

Все рассмотренное в предыдущих пунктах нашего изложения 
одинаково применимо к событиям, количественно определенным 
на любом из указанных уровней. Дальнейшее изложение поведем 
с учетом различий в этих уровнях. 


*Дело в том, что операции вычитания и деления лежат в основе опреде- 
ления метрических мер, в, согласно определению, на уровне упорядоченных 
событий меры ие используются. Однько числь (баллы, рангн), которыми 
перенумерованы и в которые отображены события (см. рис. 1.13), onpene- 
лены в метрическом пространстве: они суть целочисленные значения точек 
клидова пространства, которые можно и вычитать, и делить. 

**Термин «измерение» употребляется в широком и в узком смысле. В 
широком смысле под измерением понимается приписывание чисел вещам 
в соответствии с установленными правилами (Стивенс С.С. Математи- 
ка, измерения м психофизика// Экспериментальная психология: В 2т. Т. 1. 
M., 1963). В тьком смысле классифицирование и упорядочивание событий — 
разновидности измерения. В узком смысле измерение понимается в метро- 
логии. Здесь под измерением имеют в виду отношение измерлемой величи- 
ны к величине того же рода, принятой зь единицу измерения. Результьтом 
измерения является число, показывающее, во сколько раз измеряемая вели- 
чинь больше (меньше) единицы измерения (Маликов С. Ф., Тюрин Н.И. 
Введение в метрологию. M., 1965). Мы пользуемся эдесь и ниже понятием 
измерения в узком смысле. 
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Для безошибочного расчета частот, частостей или вероятно- 
стей случайные события необходимо рассматривать в полной 
группе. Если даже нас интересует случайное событие А, то обяза- 
телен учет его дополнения А, т.е. любых других случайных собы- 
тий, которые, может быть, нас и не интересуют, но появляются в 
опыте. Поэтому, интересуясь возможностью появления (непоявле- 
ния) события А, изучают как минимум систему противоположных 
событий А = (А,А), которую при надобности разворачивают в 
более сложную систему, тоже являющуюся полной группой собы- 
тий. 

Пусть имеется система случайных событий, образующая пол- 
ную группу: 

А= (Ар, А2,....Аь) = (А), 
где i = 1,2, индекс, определяющий положение события в 
записи системы. Распределением вероятностей системы А будем 
называль отображение событий этой системы во множество чисел 


Р=(Р,Рь...,Рь)=(Р)), (1.6) 


элементы которого принимают значения из интервала (0 + 1) ив 
сумме равны единице 


& 
OCR <1 и PtP te tha Р=1. (1.7) 
ре 
Назовем множество (1.6) множеством вероятностей и обозначим 
отображение А -—- Р Kak P(A). Тогда в общем виде распределение 
вероятностей записывается перечнем вероятностей, помеченных 
событиями, к которым вероятности относятся; например, 
P(A) = [P(A1), Р(Аз), ..., Р(А»]] = [P(As)] = 
А, А», » Ab А; (1,8) 
= (Р, Pa, Р) = (PF), 
где i = 1,2,...,Ё— по-прежнему индексы событий и их вероят- 
ностей. Отметим, что в числовом виде распределения частот 
и частостей удобно записываль как мультимножества, например: 
F(A) = (20А, 80А) + P(A) = (20A : 100, 80A : 100) = (0,24, 0,8A). 
Соотношения (1.7) определяют числовые множества как множе- 
ства вероятностей либо частостей и называются ‘условиями нор- 
Mupoexu распределений. Эти условия должны проверяться и вы- 
полняться на практике с ошибкой не более 1%. Так, например, 


распределение вероятностей противоположных событий, по опре- 
делению: P(A) = (Px, РА) и Ру + РА = 1, откуда 


РА=1-Р№ и № =1-Р, 

т.е. вероятность одного из противоположных событий выража- 
ется по условию нормировки (1.7) через вероятность другого из 
этих событий. Пусть в результате наблюдения из десяти случа- 
ев трижды появилось событие А. Тогда его частость — здесь она 
служит грубой эмпирической оценкой вероятности — составляет 
pa = 0,3, а частость противоположного события составляет рх = 
1-0,3 = 0,7; таким образом, получилось распределение частостей 


P(A) = oy 03) = (0,74, 0,3A). (1.9) 


В соответствии с рассмотренными видами событий различают- 
ся безусловные либо условные, изолированные либо совмещенные, 
общие либо частные распределения, а также распределения, ха- 
рактеризуемые сочетанием перечисленных признаков. 

Распределения (1.8) и (1.9) называются безусловными, так как 
никаких условий не оговаривалось. Но пусть учитывается усло- 
вие В, при котором не появляются либо появляются события А, А, 
так что вместо безусловной системы А наблюдается условная си- 
crema А/В = (А/В, А/В), где А/В, А/В — противоположные, но те- 
перь условные события. Тогда распределение 


P(A/B) = (Рхув» Ра/в) (1.10) 


называется условным распределением системы .А при условии В. 
Но условию В противоположно его дополнение В; поэтому всегда 
имеет место система условий В = (B,B), при которых рассматри- 
ваются какие-то системы событий. Так что наряду с (1.10) изуча- 
ется и условное распределение 


P(A/B) = (Руль Рав), 


которое вместе с (1.10) записывается в матрицу условных распре- 
делений системы А при условиях В: 


P(A/B) = [P(A/B); P(A/B)] = 
= (Papp: Papi Pay: Ра/в)- (1.11) 


В записи (1.11) точка с запятой отделяет условные распределения, 
а запятые отделяют условные вероятности (вероятности условных 
событий) в составе каждого распределения. Матрицу (1.11) часто 
‘удобно записывать, транспонируя условные распределения, раз- 
деляя их пунктиром и помечая строки и столбцы обозначениями 
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событий и условий: 


В B 
А (Pap i P; 
P(A/B) = [P* (А/В) :P* (АТВ) = д (ee | =) (2.12) 


Совмещенные распределения в отличие от предыдущих харак- 
теризуют системы совмещаемых, рассматриваемых вместе, собы- 
тий. Например, для двух систем противоположных событий полу- 
чается двумерное совместное распределение 


в в 


pas) =^ (BE pe). (1.13) 


элементы которого Р;; (rae i = A,A € Au j = B,B € В) — это co- 
вместные вероятности (вероятности совмещенных событий), при- 
чем выполняется условие двумерной нормировки 


УР =У УР =Ь (1.14) 
7 ga 


перестановка индексов в (1.14) означает изменение порядка сум- 
мирования. 

Распределение (1.13) называется общим, так Kak, суммируя в 
нем столбцы (т.е. суммируя «по В»), получаем частное безуслов- 
ное распределение вероятностей событий в А: 


PIA) = PAB) = Нее] a F(R). (1.15) 


а суммируя строки (т.е. суммируя «по A»), получаем частное 
безусловное распределение для системы В: 


р вв 
P18) = (AB) = (+; +1 ) = (Ps, Ps); (116) 


ориентация этих распределений зависит от компоновки совмест- 
ного распределения (1.13). 

Каждую из одномерных подсистем двумерной системы собы- 
тий можно интерпретировать в качестве обусловливающей дру- 
гую подсистему. Поэтому кроме матрицы условных распределе- 
ний (1.12) здесь существует матрица условных распределений 


8 B 


> K (Pax Р 
a [P 6M). ° (22.2% 
P(B/A) = [еж (= ний Я (1.17) 


в которой условные распределения тоже разделены пунктиром и, 
кроме индексов условных вероятностей, отличаются от (1.12) тем, 
что расположены в виде строк соответственно обозначениям усло- 
suit. 

Ms элементарной теории вероятностей известно, что вероят- 
ность совместного появления пары зависимых событий опреде- 
ляется произведением безусловной вероятности одного из них на 
условную вероятность другого: 


Pap = РАРв/л = PaPajp, (1.18) 


а также, что путем суммирования совместных вероятностей собы- 
тия, совмещаемого с событиями, которые образуют полную груп- 
пу событий, вычисляется безусловная вероятность этого собы- 
тия, — это так называемая формула полной вероятности: 


Pr =D Paw, = LPs, Paya, (1.19) 


На основании формул (1.18) и (1.19) определяется апостериорная 
вероятность условия B,, т.е. условная вероятность конкретного 
условия из полной группы условий, которая оценивается в резуль- 
тате того, что изучаемое событие А произошло: 


Рв./л = Рав, : Pa = Pa, Pays, : Pa = Рв,Радв, : D> Рв,РАув,- (1-20) 


Это так называемая формула Бейеса, применяемая при статисти- 
ческой проверке гипотез. 

Скалярные равенства (1.18) — (1.20) можно заменить обобщаю- 
щими их матричными уравнениями распределений вероятностей 
для двумерной системы случайных событий: 


P(A) = S>P(AB), P(B) = J P(AB); (1.21) 
в A 


Р(АВ) = P(A) 0 P(B/A) = P(B) о Р(А/В); (1.22) 
Р(А/В) = P(AB)8P(B), P(B/.A) = P(AB)8P(A), (1.23) 


в которых знаками «о» и «8» обозначены смешанное умножение и 
деление матриц (см. Приложение 1). Эти уравнения использованы 
в равенствах (1.12) и (1.15)-(1.17). 

Пример 1.5. Из двух учебных групп по жребию отобрано по 
15 студентов, решивших на экзамене не меньше одной из трех пред- 
ложенных всем задач A,B,C. Эта ситуация моделируется в ви- 
де двумерной системы случайных событий, совмещаемой из одно- 
мерных подсистем: «Группаз —Я`=(1, 11), «Задачи» — 9=(А, В, С), 
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аналогично (1.4): 


Io 
A А [АГ АП 
axx=(2) хо-в BI ВИ 
с c\ci Cl 
В этой системе совмещенные события AI, All, ... ‚СИ интерпрети- 


руются как решения i-it задачи j-m студентом (точнее — студентом 
из 1-й группы); i = A,B,C, j = 1,1]. Группируя эти события, как 
это было сделано в табл. 1.1, можно подсчитать совместные часто- 
ты решений и записать их в матрицу совместного распределения 
частот, например, так: 


ги 


А [15 15 
яад=в| 3 9 
cle 6 


или в виде табл. 1.2, в центральной части которой размещена та 
же матрица. Суммируя столбцы и отдельно строки, получаем без- 
условные частоты задач и групп — последний столбец и нижняя 
строка табл. 1.2, суммы в которых определяют общее число ре- 
шенных студентами задач. 


Таблица 1.2 
Распределения частот событий к примеру 1.5 


Дальнейшие расчеты можно выполнять в частотах или часто- 
стях, вычисляя одни распределения через другие, записывая рас- 
пределения в виде векторов-строк, как в (1.11), или в виде поме- 
ченных матриц, какв (1.12). В этом примере выполним расчеты по 
совмещенному распределению в частостях, приведенных в пентре 
табл. 1.3, применяя помеченные матрицы. 

Совместные частости получены делением совместных частот из 
табл. 1.2 на общее число решений: Pay = Pay = 15 : 50 = 0, 30; Ри = 
3:50 = 0, бит. д. Затем, сообразуясь с формулами (1.15) и (1.16) и 
суммируя столбцы, а потом строки совмещенного распределения, 


Таблица 1.5 
Распределения частостей событий к примеру 1.5 


находим частные безусловные распределения решенных задач и 
решавших задачи групп: 


1 и 


А [0,30 + 0,30\ A /0,60 
Р(3) = SO PGF) = В | 0,06 + 018)=B (02). 
я с \ 0,04 + 0,12] С \o,16 


1 Ш 
д / 40:30 ,0.30 ги 
= = В 0,06 0,18 | = (0,40 0,60) 
P(F) =) Par) = [+ в , , 
9 0,04 0,12 
Далее, пользуясь формулами (1.23), вычисляем матрицы условных 
распределений частостей: 
— решавших задачи групп, при условии, что группами реша- 
лась конкретная задача, 


2(5/3) = Р(39)8Р(3) = 
I п I И 


А (0,30 030\ A ogo, А [(0,30 0,30) : 0,60 
=в| 0,06 0,18 |8В (031) - B| (0,06 0,18) : 0,24] = 
С \ 0,04 0,12 0,167 С \ (0,04 0,12) : 0,16 

I и (юн 


А [ 0,30:0,60 0,30: 0,60 А (0,50 0,50 


— решенных задач, при условии, что задачи решала определен- 
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ная группа, 


1 ou 
A (0,30 0,30 ги 
P(3/T) = P(BF)8P(F) = В | 0,06 0,18 |8 (04 06) = 
С \ 0,04 0,12 
I И 
A| (0,30 0,30 
=В| | 006 | : 0,4] 0,18 | :0,6] = 
С | \o04 0,12 
1 ul 1 и 
А (0,30:04 } 0,75 | 0,50 
= B] 0,06:0,4 } 0,15 | 0,30 
С \ 0,04:0,4 | 0,10 | 0,20 


Отметим, что частные условные распределения в полученных ма- 
трицах разделены пунктиром и что для каждого из них выполня- 
ется условие нормировки (1.7). 

Следует обратить внимание на то, что, определив сначала об- 
щее совмещенное распределение частостей событий, из него по- 
том расчетным путем получили все остальные, возможные в дан- 
ной системе, частные распределения. Следовательно, двумерное 
совместное распределение полностью определяет двумерную си- 
стему совместимых событий и в этом смысле является полным. 
Обобщая это на более сложные случаи, запомним, что многомер- 
ную систему случайных явлений полностью характеризует лишь 
многомерное совмещенное вероятностное распределение той же 
мерности. Отсюда практическое требование планироваль иссле- 
дование так, чтобы в результате получать возможно более полное 
распределение вероятностей, иначе информация необратимо те- 
ряется. Но если по каким-то причинам полное распределение в 
целом сразу не получить, то его необходимо восстановить, вычи- 
сляя через одно из возможных смешанных произведений частных 
безусловных и условных матриц распределений. 

Согласно уравнениям (1.22), можно восстановить полное рас- 
пределение двумя разными способами — через произведение P(A)o 
P(B/A) или через произведение P(B) о Р(А/В). Например, пусть 
установлено, что студенты | группы решили всего 20 задач, в том 
числе 15A, ЗВи 2С, а такое же количество студентов из II группы 
решили 30 задач, в том числе 15A, 9B, 6С. Перенормировав эти 


данные: (15 : 20)А, (3: 20)В и т.д. получим матрицу условных 
распределений задач, решенных той и другой группами: 


т п 
А (075 | 050 
P(3/7) = В | 0,15 | 0,30 |. 
С \ 0,10 |} 0,20 


Затем, нормируя количество решений по группам общим числом 
решений, вычисляем безусловное распределение решений в груп- 
пах— 20: (20+30) = 0,4; 30 : (20+30) = 0,6; так что P(F) = (0,4; 0,6). 
Перемножая полученные малрицы, восстанавливаем полное рас- 
пределение: 


PIT) = (3/7) о P(T) = 
I И 1 ou 
А (075-04 0,5-06\ A [0,30 0,30 
= В | 015-04 0,3-0,6 | = В | 0,06 0,18 
С \ 0.10.04 0,2.0,6/ C\004 0,12 


Проверяя, убеждаемся, что сумма совместных вероятностей равна 
единице, следовательно, вычисления безошибочны. Далее по пол- 
ному распределению вычисляются остальные матрицы распреде- 
лений, как это было сделано выше. 

Матричные уравнения распределений (1.21) — (1.23) можно об- 
общить на многомерные системы случайных явлений. Но количе- 
ство вариантов быстро увеличивается, так как появляются част- 
ные распределения компонентов системы. В частности, нарялу 
с полным трехмерным распределением вероятностей в случае со- 
вмещения трех групп случайных событий нужно рассматривать и 
вычислять не только одномерные, но и двумерные совмещенные 
распределения, а также двумерные и трехмерные матрицы услов- 
ных распределений — для одной группы событий при условии со- 
вмещения двух других групп и, наоборот, для совмещенных двух 
групп при условии событий третьей группы. Комбинируя вариан- 
ты, можно записать и использовать разные матричные уравнения 
распределений, например: 


P(A) = УХУ P(ABC), Р(АВ) = У`Р(АВС), } 
вс с ы (1.24) 
P(ABC) = P(A) о P(CB/A) = P(AB) о Р(С/АВ) 


Аналогичные уравнения можно записать и для частотных распре- 
‘делений. 
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Психологи нередко затрудняются в правильной организации 
‘наблюдений и не реализуют возможность количественно охарак- 
теризовать систему эмпирических данных с необходимой и доста- 
точной полнотой. Чтобы не потерять такую возможность, необхо- 
MMO четко выделять исследуемые свойства, которые могут быть 
совместимыми у изучаемых объектов, обследуемых людей или си- 
туаций; затем надо выбрать надежно различимые градации (при- 
знаки) этих свойств и принять эти градации за несовместные со- 
бытия, образующие полную группу каждого свойства. Следует 
подходящим образом обозначить группы свойств и их градации. 
Только после этого можно обратиться к планированию экспери- 
мента и наблюдений, в которых получалось бы полное совмещение 
событий из выделенных групп свойств. 


C формальной стороны такое планирование можно представить 
следующим образом. Пусть 1=(1,2), 1=(1,2), И=(1,2) — полные 
группы альтернативных событий, так что Tx П = (11, 12,21,22) 
wx Wx WI = (111,112, 121,122, 211,212,221,222) — дву- и трех- 
мерные системы, полученные совмещением событий. В резуль- 
тате п наблюдений п1,пз раз появлялись события | группы, так 
что п = п! +п2. В то же время из п; либо ng события 1 груп- 
пы оказались совмещены с событиями II группы в количествах 
п11, П12, 21, N22, причем п; = пи +112, п? = 121 +122. Точно так же с 
парными сочетаниями событий были совмещены события Ш груп- 
пы — с частотами п111, M112, 7121, 122, M211) M212, 1221, 1222, При этом 
Nyy = пи: + M112, M12 = 7121 + M122, M21 = N11 +1212, 122 = п221 + 222. 
Такова общая модель эмпирического изучения трехмерной систе- 
мы противоположных событий (рис. 1.7, а). Конкретизируем эту 
модель. 

Пример 1.6. Лля оценки личностного потенциала социальных 
общностей необходимы данные о статистических распределени- 
ях личностных свойств людей, образующих общность, с учетом 
разных демографических, социальных и других характеристик. 
Пусть в результате предварительного обследования по методи- 
ке Г. Айзенка отобрано 100 человек, мужчин и женщин, с уклоне- 
ниями по фактору «экстраверсия-интроверсия», сочетавшими- 
ся либо нет с выраженным нейротизмом. При этом оказалось, 
что на 40 мужчин пришлось 8 экстравертов, в том числе 1 с вы- 
соким нейротизмом, и 32 интроверта, из которых 22 — без ней- 
ротизма; в то же время из женщин лишь 6 оказались экстра- 
вертированными, в том числе 5 — без нейротизма, а остальные 
54 были интровертированными, из них 22 с высоким уровнем ней- 
ротизма (рис. 1.7, 6). Заметим, что на графе в виде уровней 
представлены частотные распределения обследованных людей: 
по полу— (55) = (40м, 60ж), по полу и экстра—интроверсии — 
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Рис. 1.7. Графы совмещдемых событий из трехмерной систе- 
мы альтернативных событий. 
«— общий случай (я — общее число наблюдений; плз — рас- 
пределение частот событий первой подсистемы; п11,... ‚паз — 
распределение совместных частот событий первой и второй 
подсистем; пил, ...,па22 — распределение совместных частот 
событий первой, второй и третьей подсистем), 6 — пример 1.6. 


F(K-FU) = (8мэ, 32ми, бжэ, 54жи), по полу, экстра—интроверсии 
и отсутствию-наличию нейротизма — F(T «HU - №) = (7мэн, 1мэн, 
22мия, 10мин, 5жон, 1жан, З2жин, 22жин). Последнее, трехмерное, 
распределение является полным, что позволяет вычислить другие 
возможные здесь распределения. 

Действительно, хотя распределение частот по полу имеется в 
явном виде, его можно вычислить, суммируя совместные частоты 
по исключаемым свойствам, как в уравнениях (1.24): 


F(R) = YY FH вии) = | (Too, Looe, 22мив, Lown), 
mH 


(SoH + Lacon + ЗЭжия + 22am)] = (40м,60ж). 


Аналогичным путем, суммируя по исключаемым свойствам, по- 


лучаем одномерные распределения обследованных по экстра— 
интроверсии 


F (9) = Уля и. H) = [(tson+ lon + 5жэн + 1жен), 
KKH 


(22мин + 10мин + ЗЭжий + 22ин]] = (140, 86и) 
и по нейротизму 


F(#) =O я. м)= [мои 22мин + Эжен + 
K HU 


+ З2жий), (1мэн + 10мин + Deon + 22жин)] = (667, 34n), 


которые в явном виде отсутствовали. 

Так же обстоит дело с двумерными распределениями. В яв- 
ном виде получено совместное распределение людей по полу и 
экстра—интроверсии, но его можно вычислить из полного рас- 
пределения: 


F (KP) = SF (HHH) = [моя + 1мэн), (22мий + 10мин), 
Е 


(бжан + 1жен), (ЗЭжия + 2жин]] = (8мэ, 32ми, бжа, БАжи). 


Аналогично вычисляются отсутствовавшие в явном виде распре- 
деления частот людей по полу и нейротизму 


F (KH) = У F(K- HH) = [пмэн+ 22m), (1мэн + 10мин), 
Fl 


(бжен + З2жи), (1жэн + 22жин]] = (29M, Имн, ЗТжИ, 23жн) 
и по экстра—интроверсии и нейротизму 


F(IU-H) = FH -FU- He) = [(тмэн+ же), (1мен + 1жен), 
я 


(22мин + З2жин), (10мин + 22жин| = (1208, 2эн, 54ия, 32ин). 


Таким образом, все безусловные, одно- и двумерные, частотные 
распределения свойств обследованных людей получены из полно- 
го частотного распределения. Все эти распределения преобра- 
зуются в распределения частостей, если их разделить на об- 
щее количество наблюдений; например, P(H) = F(H) : 100 = 
(0,4м, 0,6ж). 

Далее необходимо вычислить все условные распределения. По 
двумерным распределениям, учитывая формулы (1.23), вычисля- 
ются шесть матриц условных распределений: 


— матрица частостей экстра—интроверсии при условии муж- 
ского, женского пола, 


Р(ви/эт) = F (IC 9983) = 
= (вмз, 32ми) : 40ы; (бжэ, 54жи) = 60%] = (Bo : 40м, 32ми : 40м; 
бжа : б0ж, Б4жи : 60ж) = (0,2э/м, 0,8m/m4; 0,13 /, 0.ди/ж); 


— матрица частостей мужского, женского пола при условии 
экстра—интроверсии 


P( S/H) = F (I - PU)BF (HU) = [вмо,бжэ) 2149; 
(32ми, 54жи) : 86] = (0,57м/з,0,43ж/э; 0,37ы/и, 0,63ж/и); 


— матрица частостей экстра—интроверсии при условии нейро- 
тизма 


P(PU/H) = F(AUH)BF(H) = [(azeR, 54ин) - 66%; 
(2m, 320m) : З4н] = (0,189/H,0,824/7; 0,060/u, 0 94и/н); 


— матрица частостей нейротизма при условии экстра—интро- 
версии 


Р(Ж/М) = (М 3)BF (9U) = {(120H,, 2on) : 149; 
(54ия, З2ин) : 86] = (0,86/э,0.14н/з; 0,6Зн/и, 0,37н/и); 


— матрица частостей нейротизма при условии мужского, жен- 
ского пола 


Р(ж/ж®) = F(R ЖЕ (9) = [ом Имн) : 40m; 
(87 ct, 23x) : 60] = (0,72587/a,0,2751/ 4; 0,62H/, 0.38н/; 


— наконец, матрица частостей мужского, женского пола при 
‘условии нейротизма 


Р(я/*) = АЖ. HBF (H) = [боя STi) : 668; 
(Имн, 23жн) : ан] = (0,44м/я, 0,56ж/я; 0,32м/н, 0,68ж/н) 


(напомним, что в линейной записи матриц условные распределе- 
ния отделяются друг от друга точками с запятой, а условные ча- 
стости — запятыми). 

Теперь осталось вычислить по полному распределению еще 
шесть матриц условных распределений — три условно-совместных 


Отредактировал и опубликовал на сайте 


и TPH совместно-условных. Условно-совместными будем называть 
распределения частостей (вероятностей) отдельных событий при 
условии совместного появления других событий. Эти матрицы 
вычисляются смешанным делением матрицы трехмерного распре- 
деления на матрицы двумерных распределений частостей усло- 


вий: 
— матрица условно-совместных распределений частостей муж- 


ского, женского пола при условии экстра—интроверсии и нейро- 
тизма 


P(I/SU-H) = F(K - HU. H)BF(HU-H) = 
= |[(@мон, бжен) : 1208; (1мон, kon) : 2эн; (22мия, З2жий) : 54иЯ; 
(10мин, 22жин) : Зин] = (0,58M/ 2H, 0,42ж/эн; 0,5м/ен, 0,5ж/эн; 


0,41м/ия, 0,59ж/ия; 0,31м/ин, 0,69ж/ин); 


— матрица условно-совместных распределений частостей экс- 
тра—интроверсии при условии мужского, женского пола и нейро- 
TH3Ma. 


P(HU/ KH) = (Я.И. H)BF(K -H) = 
= [мов, 22мин) : 29мй; (1мэн, 10мин) : 11мн; (бжен, З2жин) : З7жЯ; 


(1жан, 22жин) : 23x] = (0,24э/ми, 0,761/ mi; 


0,09э/мн, 0,91и/мн; 0,135э/жя, 0,865и/жя; 0,040 /жн, 0,9би/жн); 


— матрица условно-совместных распределений нейротизма при 
условии мужского, женского пола и экстра—интроверсии 


P( H/T A) = F(K . 5. H)BF(K - HU) = 


= [(мов, 1мэн) : 8мэ; (22мий, 10мин) : 32ми; (бжон, 1жен) : бже; 


(З2жий, 22жин) : Би] = (0, 875н/м», 0, 125н/мь; 
0, 69H/mu, 0, З1н/ми; 0, 8ЗН/ж», 0, 17н/жэ;0, 5ЭН/жи, 0,41н/жи). 


Совместно-условными будем называть распределения часто- 
стей (вероятностей) совмещенных событий при условии изолиро- 
ванного появления других событий системы. Вычислим такие ма- 
трицы: 

— для распределений частостей экстра—интроверсии и нейро- 
тизма. при условии мужского, женского пола, 


P( SU. H/I) = F(R - HU - H)BF(H) = 


= [(7e, 1мен, 22мин, 10мин) : 40m; (5жэй, 1жэн, ЗЭжий, 


22жин) : 60» = (0,175эн/м, 0,025эн/м, 0,55ия/м, 
0,25ин/м; 0.08Зэв/ж, 0.017эн/ж, 0,5Зи/ж, 0,ЗТин/ж); 


— для распределений мужского, женского пола и нейротизма 
при условии экстра—интроверсии 


P(H - Ht /SU) = FH - HU. H)BF(SU) = 
= [(пмов, 1мен, 5x08, 1жеэн) : 140; (22мин, 10мин, З2жин, 


22жин) : 86и] = (0,5мй/э, 0,07мн/э, 0,36жН/э, 0,07жн/а; 
0,26мя/и, 0,12мн/и, 0,37жн/и, 0,26жн/и); 


— для распределений мужского, женского пола и экстра—интро- 
версии при условии нейротизма 


P(H - SU/H) = FIC -FU--H)BF(H) = 
= [(7мэя, 22мия, жен, ЗЭжин) : 668; (1мэн, 10мин, 
1жан, 22жин) : З4н] = (0,11мэ/я, 0,33ми/я, 0,.08жэ/я, 
0,48жи/; 0,03мэ/н, 0;29ми/н, 0,03жэ/н, 0,65жи/н) 


До сих пор рассматривались уравнения распределений веро- 
лтностей либо частот и частостей общего вида — для зависимых 
событий, для которых, по определению, появление одних событий 
изменяет вероятность появления других событий. Это означает, 
что условные вероятности событий отличаются от безусловных 
вероятностей тех же событий, и, следовательно, условные распре- 
деления отличаются от соответствующих безусловных распреде- 
лений. Так как величина этих отличий может быть и пренебрежи- 
мо малой и значительной, то строго формулировать можно лишь 
‘условия независимости событий и систем событий. Tax, например, 
два совместимых события независимы, если 


РА=РАв и Pa = Paya. (1.25) 


Аналогично этому две системы совместимых случайных событий 
А, В определяются как независимые, если безусловные распреде- 
ления вероятностей равны условным распределениям: 


P(A) = P(A/B;) и P(B) = P(B/Ai), (1.26) 
где В; Е В, А; Е А. Эти условия легко обобщаются на конечно- 
‘мерный случай: 

P(X) = Р(Х/А) = P(X/AiBy) = --- = Р(Х/А.Ву...1ь), (127) 
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где А; Е A, В; Е В,..., 2» Е 2, причем A,B,...,Z, АВ, AZ,..., 
АВ,...2 Е X, так что, например, для любых трех событий А, B,C, 
опустив индексы, можно записать: 

РА = Рав = Payc = Радвс, 

Ps = Paya = Рь/с = Pajac, 

Po = Peja = Pop = Poyas, 


Рав = Papyc, 
Pac = Pacjs, 
Pac = Pacya- 


Ms условий независимости следует, что в отличие от (1.18) 
и (1.19) совмещение событий, если они независимы, определяет- 
ся произведением их безусловных вероятностей, а совмещенная 
система независимых событий определяется хронехеровым (тен- 
зорным) произведением безусловных распределений вероятностей 
компонентов системы: 


Р(АВ...2) = P(A) @ P(B) @ --@ P(Z), (1.28) 


где любая полная совместная вероятность Pap z= PaPp-...- Pz. 

Сравнивая формулы (1.18), (1.19), (1.23), (1.24) и (1.25) — (1.28), 
можно видеть, что независимость случайных явлений значитель- 
но упрощает вероятностные описания и расчеты. Но в реально- 
сти независимость случайных событий и других явлений не всегда, 
очевидна, даже если она существует. Рассмотрим три случая не- 
зависимости событий. 

1. Системы совместимых событий с равномерными распределе- 
ниями вероятностей независимы. Пусть P(AB) = (0,25AB, 
0,25АВ, 0,25AB, 0,25 АВ). Тогда P(A) = ув P(AB) = 4 P(AB) = 
Р(В) = (0,5B,0,5B) и P(A/B) = [P(A/B);P(A/B)] = (0,25AB : 
0,5B,...,0,25AB : 0,58) = (0,5A/B, ОБА/В; 0,5A/B, 0,5A/B) = 
{P(B/A);P(B/A)] = Р(В/А)— все условные распределения равны 
«своим» безусловным распределениям. 

2. Системы совместимых событий, в которых хотя бы одно из 
частных распределений вероятностей равномерное, являются не- 
зависимыми. Пусть P(A) = (0,5A, 05А),Р(В) = (0,1B, 0,98). 
По (1.28) в случае независимости P(A) ® Р(В) = (0,5А, 0,5А) ® 
(0,1B, 0,9B) = (0,05АВ, 0,45AB, 0,05AB, 0,045 АВ) = P(AB). Вычис- 
ляем: 

P(A/B) = P(AB)8P(B) = 
= [(0,05АВ, 0,05AB) : 0/18; (0,45АВ, 0,45 АВ) : 0,98] = 


= (0,5А/В,0,5А/В;0,5А/В, 0,5А/В), 


т.е., какив (1.26), P(A) = Р(А/В). Аналогичное равенство имеет 
место и для группы событий В, в чем читатель может убедиться 
самостоятельно. 

3. Системы совместных событий с неравномерными распре- 
делениями вероятностей компонентов, для которых выполняется 
формула (1.28), независимы по определению. Пусть, например, 
P(A) = (0,1A, 0,9А),Р(В} = (0,8B, 0,2B) и P(AB) = Р(А)®Р(В). 
Вычислим это тензорное произведение и матрицы условных рас- 
пределений: 


Р(АВ) = (0,14, 0,9A) @ (0,8B, 0,2B) = 
= (0,08AB, 0,02AB, 0,72AB, 0,18AB); 


P(A/B) = P(AB)8P(B) = 
= [(0,08AB, 0,72AB) : 0,88; (0,02AB, 0,18AB) : 0,2B] = 
= (0,1A/B, 0,9A/B, 0,1A/B, 0,9A/B) 


P(B/A) = P(AB)8P(A) = 
= [(0,08АВ, 0,02AB) : 0,1A; (0,72AB, 0,18AB) : 0,9A] = 
= (0,8B/A, 0,2B/A; 0,8B/A, 0,2B/A). 


Сравнивая безусловные и условные распределения, убеждаемся в 
выполнении условий независимости (1.26). 

Из рассмотренных случаев можно сделать два практических 
вывода. Во-первых, если в изучаемых системах событий среди 
распределений вероятностей имеется хотя бы одно, точно или при- 
ближенно равномерное, что оценивается визуально по эмпириче- 
ским данным, то события и системы событий независимы, поэтому 
‘специальной статистической проверки гипотезы о независимости 
здесь не требуется. Во-вторых, если распределения совместимых 
событий неравномерны, то события и их системы независимы, ко- 
гда тензорное произведение безусловных распределений, которые 
вычислены из совместного распределения частостей, приблизи- 
тельно равно этому совместному распределению. Приближение 
допустимо, если ошибка в отношении к максимальной разности 
вычисленных и наблюдавшихся совместных частостей не превос- 
ходит 10 15% от наблюдавшейся частости. Если ошибка больше, 
требуется статистическая проверка гипотезы о независимости со- 
бытий, которая будет рассмотрена в дальнейшем. 


|.1 1, Ранжирование событий в системе по вероятностям 
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Если события в системе не равновероятны, то вероятность 
можно рассматривать как характеристику значимости события, — 
конечно, только в смысле возможности появления и только в дан- 
ной системе событий, образующих полную группу. В этом смы- 
сле и говорят о вероятностном «весе» события (или о «весе» по 
вероятности}*. События с большой вероятностью имеют боль- 
шой «вес», а события с малой вероятностью — малый. При геоме- 
трическом изображении вероятностей событий аналогия с весом 
в его обычном понимании достаточно полная. Эта аналогия осно- 
вывается на привычке оценивать физический вес предмета по его 
зрительно воспринимаемой величине. Поэтому-то геометрически 
большая площадь и ассоциируется в нашем представлении с боль- 
шим весом фигуры. «Вес» события является одной из важнейших 
его характеристик в системе событий, поскольку по «весу» со- 
бытия в системе можно сравниваль и упорядочивать. Обычно из 
большого числа событий представляют интерес не все, а лишь до- 
статочно частые события. 

Наиболее вероятное событие (или класс событий) в системе на- 
зывается модальным событием (классом) или просто модой. Ис- 
ключив из рассмотрения моду, среди остальных событий можно 
найти новое модальное событие, затем среди оставшихся — новую 
моду и т.д. Таким путем все события в системе можно упорядо- 
чить (ранжироваль) по убыванию их вероятности. Ранжирование 
можно выполнить и по возрастанию «веса» событий. После ран- 
жирования событиям присваиваются порядковые номера** (или 
ранги), которые приближенно характеризуют (в числах натураль- 
ного ряда) возможности появления событий в системе. Ранжиро- 
ванные по вероятности события удобно представлять графически 
в виде столбиковых и круговых диаграмм распределения вероят- 
ностей, 

Пример 1.7. В табл. 1.4 представлено распределение диагно- 
зов психически больных людей, обследованных при изучении рас- 
стройств мышления***. Можно видеть, что среди девяти забо- 
леваний равновероятными являются только три; остальные су- 


*В смежных науках, используемых в психологической прьктиже, понятие 
«вес» многозначно: «вес» в смысле субъективной или объективной ценности 
(теория игр), в смысле стабильности результатов измерения от опыть к OLA 
ту (теория вероятностей, метрология), в смысле количествь информации. 

*Если два или более событий разновероятны, то им присвьивьется одно 
и то же среднее значение из порядковых номеров, которые они лолучили бы, 
будучи неравновероятными, 

***ЗойгарникБ. В. Патология мышления. M., 1962. С. 70. 


щественно не равновероятны. Модальный диагноз— травмы го- 
ловного мозга, на втором месте (по убыванию вероятности) — 
шизофрения, на третьем — сосудистые заболевания головного моз- 
га. Эти три диагноза имеют место с вероятностью (суммарно) бо- 
лее 2/3, тогда как остальные шесть диагнозов — только 1/3. Ран- 
жировав все диагнозы по убыванию вероятностей, получаем та- 
бл. 1.5, из которой хорошо видны сравнительные «веса» каждо- 
го из девяти диагнозов. Отметим, что равновероятные энцефали- 
ты, прогрессивный паралич и психопатии получили ранг, равный 
среднему из рангов (6, Ти 8), которые они занимали бы, будучи 
неравновероятными. 


Таблица 1.4 
Исходное распределение больных по диагнозу 


`Дивгноз (зболев Оценка 


вероятности 
Шизофрения 0,25 
Эпилепсия 0,07 
Сосудистые заболевания головного мозга 0,22 
Травмы головного мозга 0,26 
Олигофрения 0,06 
Энцефалиты 0,04 
Прогрессивный паралич 0,04 
Маниакально-депрессивный психоз 0,02 
Психопатии 0,04 
Таблица 1.5 
Ранжированное распределение больных по диагнозу 
Диагноз (заболевание) Оценка Paur по 
ероятности | вероятности 
Травмы головного мозга. 0,26 1 
Шизофрения 0,25 2 
Сосудистые заболевания головного мозга. 0,22 3 
'Эпилепсия 0,07 4 
Олигофрения 0,06 5 
Энцефалиты 0,04 7 
Прогрессивный паралич 0,04 7 
Психопатии 0,04 7 
Маниакально-депрессивный психоз 0,02 9 


Пример 1.8. В табл. 1.6 представлены ранжированные по веро- 
ятности суждения взрослых людей (восемь лет тому назад окон- 
чивших школу), характеризующие внешний облик школьных учи- 
телей*. Изобразим эти же данные в виде диаграмм распределе- 
ния вероятностей. На рис. 1.8, а представлена столбиковая диа- 


*Бодалев А.А. Восприятие человека человеком. Л., 1965. С. 75. 
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грамма. Площади столбиков, соответствующих событиям, про- 
порциональны оценкам вероятности из табл. 1.6. Расстояния ме- 
жду столбиками могут быть произвольными, но лучше столби- 
ки расположить на одной линии, а слева или справа* поместить 
вертикальную ось, градуированную в долях для удобства чтения 
диаграммы. Круговая (или секторная) диаграмма изображена, Ha 
рис. 1.8, 6. Ее преимуществом является компактность, но при боль- 
шом количестве событий в системе (практически больше пяти) это 
преимущество становится недостатком. Для того чтобы наглядно 
представить изменение вероятностного «веса» изучаемых собы- 
тий под влиянием какого-либо контролируемого условия, столби- 
ковые диаграммы лучше располагаль друг под другом. 


Таблица 1.6 
Распределение суждений к примеру 1.8 
Суждения, характеризующие | Оценка Ранг 
вероятности | по вероятности 
Физический облик 0, 483 1 
Мимику, жесты и пластику 0,281 2 
Внешность в целом 0, 183 3 
Оформление внешности 0,053 4 
0.483 
a 
2st 
0185 
0,053 
1 2 5 4 


Puc. 1.8, Столбиковая (в) и круговая (6) 
диаграммы распределения вероятностей клас- 
сифицированных событий. 


*Если столбиков много, шкалу значений вероятности помещают и слева. 
и справа. Часто вместо шкалы значения вероятностей указывают сверху 
над столбиками, 


Пример 1.9. Как стало известно, младшие школьники предпо- 
читают сложные задания более легким*. Степень предпочтения 
меняется от первого класса к четвертому — табл. 1.7. Изменения 
степени предпочтения в выборе трудной задачи школьниками пер- 
вого — четвертого классов можно представить в виде последова- 
тельности столбиковых диаграмм — рис. 1.9. 


Таблаца 1.7 
'Вероятности выбора трудной 
и легкой задачи младшими школьниками 


Классы 
Выбор ———=/: 
1[ujmy|w 


'Трудной задачи о 0,68 | 0,93 


Легкой задачи | 0,23 | 0,20 | 0,32 | 0,07 


477 

1 класс сы Ш каа сс 
3,80 0,95 

Neaace IVraace 

0,20 
Fa — 
co 
А A А A 


Рис. 1.9. Последовательность столбиковых диаграмм к при- 
меру 1.9. 
А выбор трудной задачи, А — выбор легкой задачи. 


‚Сы: Божович Л.И. Личность и ce формирование в детском возрасте. 
M., 1968. С. 251. 


|1}. Меры связи между классифицированными событиями 
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Зависимость (связь)* между случайными событиями, как ука- 
зывалось, состоит в том, что появление одного из событий изме- 
няет вероятность появления другого события. Иначе говоря, факт 
связи между случайными событиями состоит в совместном изме- 
нении меры возможности их появления— частоты, частости или 
вероятности. По наличию или отсутствию такого изменения и су- 
дят о наличии или отсутствии зависимости между событиями. 

Связь по вероятностям не является однозначной. Поэтому, в 
отличие от детерминированных связей, связи между случайными 
явлениями вообще называются вероятностными (стохастически- 
ми) связями. Стогастическую связь между классифицированными 
событиями часто называют сопряженностью. 

Сопряженность** имеет три свойства: тесноту (степень, си- 
лу), направление и направленность. Теснота сопряженности — 
это основное свойство. Она тем больше, чем более неравноверо- 
ятно совместное появление всех зависимых в совокупности собы- 
тий. Если все события (или по крайней мере одна пара событий) 
в системе равновероятны, то, как показано выше, сопряженность 
отсутствует («нулевая» теснота). Если вероятности некоторых 
событий в системе равны нулю, а других не равны нулю, то тес- 
нота максимальна, и связь вероятностная превращается в детер- 
минированную (рис. 1.10, а). Между этими крайними случаями 
располагается множество случаев, когда теснота сопряженности 
непрерывно изменяется от нуля до некоторой максимальной вели- 
чины. Направление сопряженности определяется характером рас- 
пределения вероятностей совместного появления событий. Если 
вероятности совместного появления событий АВи АВ больше, чем 
вероятности совместного появления событий АВ и АВ, то напра- 
вление сопряженности называется положительным (рис. 1.10, аи 
5). Если, наоборот, вероятности совместного появления событий 
AB u AB больше, чем вероятности совместного появления событий 
АВиАВ, то направление сопряженности считают отрицательным 
(рис. 1.10, в)***. Направленность сопряженности характеризует 
логическое следование событий. 


*В литературе по теории вероятностей чаще используется термин €38- 
висимость», а в литературе по статистике и ее приложениям — термин 
«связь». Здесь и далее мы употребляем оба термина как синонимы. 
**Используя лаконичный термин «сопряженность», мы везде будем иметь 
в виду более точное, но длинное выражение: «стохастическая связь между 
классифицированными событиями». 
“Такое определение направлений обусловлено, как показано ниже, зив- 
ком количественных мер сопряженности. 


Рис. 1.10. Сопряженность классифицированных событий. 
«— максимально тесная положительная; 6 — положительная; 
в— отрицательная. 


В качестве мер, количественно характеризующих тесноту со- 
пряженности, используются четыре коэффициента. Два из них 
применимы только к альтернативному (четырехклеточному) рас- 
пределению, назовем их коэффициентами четырехклеточной со- 
пряженности. Лва других применимы к любой т х п-клеточной 
системе событий, назовем их коэффициентами т x п-клеточной со- 
пряженности. 

Коэффициенты четырегклеточной сопряженности вычисляют- 
ся по следующим формулам: 


ad — cb 
ona! (28) 
ad — cb 


, (1.30) 
Vat e+ ae + diate) 


где значения a,b,c,d 4 их сумм понятны из табл. 1.8. Коэффициент 
Ф известен под названием коэффициента ассоциации (связи). Он 
оценивает сопряженность только в одном направлении, и вернее 
было бы назвать его козффициентом односторонней сопряженно- 
сти. Ковффициент Q известен под названием коэффициента сопря- 
женности (контингенции). Он оценивает взаимную сопряженность, 
повтому лучше называть его коэффициентом взаимной сопряжен- 
ности. Оба коэффициента изменяются в пределах от —1 до 1. 
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Пример 1.10. По данным рис. 1.10, в и табл. 1.8 определим 
тесноту и направление сопряженности для а = 0,1,6 = 0,3,¢ = 
0,5,4=0,1 по формулам (1.29) и (1.30): 


0,1-0,1-0,5-0,3 _ 0,01—0,15 _ 0,14 _ 


901 0,140,5-0,3 = 0,0140,15 = 06 "8 
0,1-0,1-0,5-0,3 _ 0,14 _ 
6 = 0 = 0,583. 


Сопоставив полученные значения @ и Ф, можно видеть, что ко- 
эффициент Ф дает более осторожную оценку сопряженности, чем 
коэффициент ©. 


Таблеча 1.8 
Четырехклеточное (альтернативное) распределение 


События и меры возможности | А | А | Частоты, частости 
их появления или вероятности 
событий В 
B a | 6 a+b 
в с а c+d 
Частоты, частости или а+с| 5+4 atbtc+¢d 


вероятности событий A 


Связь между значениями О и Ф и совместным распределени- 
ем вероятностей событий иллюстрирует табл. 1.9. Неодинаковая 
чувствительность Q и Ф к форме совместного и безусловных рас- 
пределений позволяет рекомендовать к использованию коэффици- 
ent Q тогда, когда частоты концентрируются преимущественно в 
трех клетках таблицы 


Таблица 1.9 
К сопоставлению коэффициентов контингенции и ассоциации 
(по: Методика и техника статистической обработки пер- 
вичной социологической информации. М., 1968. С. 238) 


[^^ 18] [a А /в) 
B fis 5 20 в {19 1 2 20 0 2 
B 35 45 80 B 31 49 80 30 50 80 
А) [50 50 100] ДА) |50 50 100 50 50 100 
9=0, 59; 0,25 |9=0,94;5 $=045 


Коэффициенты т x п-клеточной сопряженмости вычисляются 
по следующим формулам: 


a | x = | oo . 
C= an или C= т (1.31) 
2 
при m#n, 
ie у NYen-1 Ke) (1.32) 


Fey при m=n. 
Здесь ф? = x? : п, М— общее число наблюдений, т и п— число 
строк и столбцов в таблице. 

Коэффициент С предложен К. Пирсоном и часто называется ко- 
эффициентом взаимной сопряженности Пирсона. Коэффициент 
К предложен А. А. Чупровым и часто называется коэффициентом 
взаимной сопряженности Чупрова. В оба коэффициента входит 
величина X?, имеющая в статистике большое значение. Мы будем 
рассматривать x? подробно в главе 5, а здесь познакомимся с ее 


вычислением: ь м 
ee (fis = 5)" (1.33) 
va 


rae ij — наблюдаемая в опыте частота, fj, — теоретически ожила- 
емая частота. 

Если вместо частот применять вероятности, то формула (1.33) 
перепишется следующим образом: 


rae n= Sj + fj — объем выборки. Рассмотрим вычисление хи 
коэффициентов С и К на примере 

Пример 1.11. По данным наблюдения определить, имеется ли 
у людей сопряженность между цветом волос и цветом глаз В 
табл. 1.10 приведены частоты совместного распределения трех 
градаций цвета глаз и четырех градаций цвета волос, а также без- 
условные распределения. В каждой клетке, соответствующей со- 
вместному появлению событий А; В, записаны три числа (сверху 
вниз): эмпирическая частота fi;, ожидаемал частота fj; и разность 
fis ~ fi- 

Ожидаемая частота fj; определяется из условия независимости 
событий, по которому частота совместного появления независи- 
мых событий равна произведению безусловных частот, деленному 
на общее число наблюдений: 


fy = ААВ, 
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Таблица 1.10 
Совместное распределение частот цвета волос (Bi) 
и цвета глаз (A,) к примеру 1.11 (по: Урбах В.Ю. 
Биометрические методы. M., 1964. С.357) 


светлые | русые | черные | рыжие | f(A;) 
By By Bs 


raen = Dy, f(Aj) = 5; ДВ;) — общее количество наблюдений; 
А) и В+) понятны из табл. 1.10. Используя значения разно- 
стей fi; — Л; (из табл. 1.10), определим слагаемые в формуле для 
x?, а затем и саму величину х?: 


60? : 


0,8 
9,9 
6,0 
6,5 
1,1 
6,5 


302; 471=19,2 2 = 105.8 106, 


По одной из формул (1.31) вычислим коэффициент взаимной со- 


пряженности Пирсона: С = \/106: (106 +680) = 0,37. Коэффи- 
циент Чупрова (1.32) дает несколько меньшую величину: К = 
V106 : 680: У2.3 = 0, 25. 

Правила использования коэффициентов Си К сводятся, во- 
первых, к правилам применения x? и, во-вторых, к следующе- 
му: считается, что коэффициент Чупрова менее, чем коэффициент 
Пирсона, чувствителен к количеству событий т х п, поэтому при 
малых значениях т х п лучше применять коэффициент К. Отме- 
тим, что оба коэффициента изменяются только от нуля до единицы 
и измеряют тесноту сопряженности, не указывая ее направления, 
о котором легко сулить по форме совместного распределения ве- 
роятностей (частот) событий. 


114. Последовательности событий 


Пусть в каждом из п последовательных испытаний может по- 
явиться одно из $ несовместных событий Ашь(? = 1,2,...,8; k = 
1,2,...,n), образующих полную группу. Пусть Ри — это вероят- 
ность появления события Ay. Тогда в результате К испытаний 
реализуется некоторая последовательность событий: 


Ап, Ain, ---, Aik—1, Ав. 


Если испытания независимые, To появление каждого {-го собы- 
тия не зависит от его места в последовательности и определяет- 
ся только безусловной вероятностью Pj. В атом случае события 
независимы в последовательности*, и такую последовательность 
событий называют последовательностью Бернулли. 

Если испытания зависимые, то появление каждого 1-го события 
зависит от того, какие события появились до него, т.е. от места в 
последовательности. В этом случае события являются зависимы- 
ми в последовательности. Такая последовалельность называется 
целью Маркова. Различают простые и сложные, однородные и не- 
однородные цепи Маркова. Если для каждого из событий услов- 
ная вероятность появиться в {+ 1-м испытании зависит от того, ка- 
кое событие появилось в k-M испытании и не зависит от информа- 
ции о событиях, наступивших во всех предыдущих k — 1-х испыта- 
ниях, то последовательность событий называется простой цепью 
Маркова; события в простой цепи Маркова зависят в последова- 
тельности только попарно. Если условная вероятность появиться 
pk + 1-м испытании зависит от того, какие события появились в 
двух или более предшествующих испытаниях, то последователь- 
ность событий называется сложной цепью Маркова; в ней события 
зависят в последовательности по два, по три и вообще — по h, где 
2<h <n. Если в реализации последовательности величина h не 
изменяется, то цепь Маркова является однородной. Простая цепь 
по определению всегда однородна. Если h переменно, то сложная 
цепь Маркова является неоднородной. 

Обычно цепям Маркова дают следующую «физическую» интер- 
претацию. Некоторая система (биологическая, экономическая, 
социальная, психическая и т.п.) может находиться BS состоя- 
ниях: Aj, Ao,..., As, несовместных и образующих полную группу. 
В некоторые (случайные или определенные) моменты времени te 
или при некоторых условиях Я; система переходит из состояния 


Отметим, что, будучи в указанном смысле независимыми в последо- 
вательности, несовместные события зависимы в совокупности (в полной 
группе). 
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iB состояние j (i = 1,2,...,5;] = 1,2,...,8) с некоторой услов- 
ной вероятностью Pi; = Р(А; | » An), причем, как определено вы- 
ше, при h = 1 последовательность состояний системы описывает- 
ся простой (однородной) цепью Маркова, а при h > 2 — сложной, 
однородной или неоднородной. Количество зависимых в после- 
довательности событий h называют «памятью» системы. В этой 
связи системы, для которых динамика состояний описывается. про- 
стой цепью Маркова, обычно называют «системами без памяти». 
В случае описания системы сложной цепью Маркова говорят о 
системе с памятью; чем больше h, тем лучше память. Легко по- 
HATb, что для многих объектов психологии человека и животных 
можно применять только сложные, в том числе неоднородные (из- 
за флуктуаций памяти) цепи Маркова. Но это не означает, что в 
психологии совсем лишено смысла применение сравнительно бо- 
лее разработанного аппарата простых цепей. Оно вполне оправ- 
‘дано для первоначальных моделей динамики состояний (и других 
событий) во всех отраслях психологической науки. 

Итак, под цепью событий будем понимать систему случайных 
событий Ау, где # = 1,2,...,8, обозначающих, в частности, состо- 
яния наблюдаемого объекта или процесса, вместе с соответству- 
ющими им безусловными вероятностями находиться в i-M состо- 
янии и условными вероятностями переходить из 1-го состояния в 
j-€, которые называются переходными вероятностями и обознача- 
ются здесь Ру;. Множество безусловных вероятностей до и после 
k-ro перехода («шага» наблюдения) образуют безусловные рас- 
пределения вероятностей Py_; и Py, rae k= 1,2, 3,..., причем для 
первого шага при k = 1 Po называют начальным распределением 
состояний. Для каждого k-ro шага совокупность переходных веро- 
ятностей Р;; образует матрицу перегодных вероятностей (матри- 
цу перехода, переходную матрицу, стохастическую матрицу — это 
все синонимы): 


Рига = ^ (1.34) 


В этой матрице P; /i — частные условные распределения вероятно- 
стей Pi; при k-tom переходе, причем для i = } они означают coxpa- 
нение предыдущего состояния. Напомним, что для каждой строки 
в (1.34) должно выполняться условие нормировки (1.7): сумма пе- 
реходных вероятностей из {-го состояния во все $ состояний равна 
единице. 


В общем случае сложных цепей указанные распределения веро- 

ятностей связаны на k-M шаге матричным уравнением 
Рь = Pri Pr/e-1, (1.35) 
а за К последовательных переходов от начального распределения 
состояний — уравнением 
В 
Pr = Ро Рио Pasi -...-Рыьа= [] Рит-1 = Po Pro, (1.36) 
mai 

где применяется скалярное умножение матриц (cM. Приложение 1), 
П-— знак произведения k сомножителей, т = 1,2,...,Ё— номера 
переходов. 

Геометрически уравнения (1.35) и (1.36) можно иллюстрировать 
на графах. На рис. 1.11, а изображен граф цепи в виде дерева со- 
бытий (исходов) при двух переходах. Если этот граф продолжить 
и свернуть, объединяя одноименные вершины и обобщая линии, 
то получится граф состояний — рис. 1.11, 6, в котором безуслов- 
ные вероятности в2одов на вершины образуют начальное распре- 
деление состояний Po, безусловные вероятности выгодов из вер- 
шин— конечное распределение состояний Рь после k переходов, а 
‘условные вероятности на петлях и дугах графа образуют матрицу 
перехода Рь/о за К шагов 


R= (Ao) a 


28 


=, мо) 


Ат/Хт-и 
„= о 


Puc. 1.11. Дерево событий (в) и граф состояний (6), геометрически иллю- 
стрирующие распределения вероятности в цепях событий (см. уравнения 
(1.35) и (1.36). 
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Матричные уравнения упрощаются для цепей Бернулли и про- 
стых цепей Маркова. Для бернуллиевской цепи характерна пол- 
ная независимость событий, и, следовательно, по определению 
(1.27), все условные распределения на k переходах остаются рав- 
ными начальному безусловному распределению вероятностей; по- 
этому Py = Po. Лля простой марковской цепи характерна лишь 
попарная зависимость между событиями и независимость по три 
и больше событий. По этой причине все переходные матрицы чи- 
сленно равны матрице первого перехода: Pyje-1 = Pisa для всех 
k > 1. Поэтому в уравнении (1.36) скалярное произведение k пе- 
реходных матриц заменяется на Ё-тую степень первой из них: 


Pr = Po: Pho, 


что, конечно, существенно уменьшает трудность эмпирической 
оценки переходных матриц простых цепей по сравнению со слож- 
ными. 

Пример 1.12. В эксперименте испытуемому #-кратно предъ- 
являют $ незнакомых объектов, из которых он после каждого 
предъявления воспроизводит ny и не воспроизводит $ — Ny объек- 
тов. Эксперимент продолжается до тех пор, пока не будут верно 
воспроизведены все объекты, т.е. пока пь не станет равно 5. В по- 
добном эксперименте возможны три ситуации. Первая ситуация: 
испытуемый не может воспроизвести ни одного нового объекта ли- 
бо, узнав сразу же некоторые, известные ему прежде, остальные 
не воспроизводит. Вторая ситуация: в каждой попытке испыту- 
емый запоминает и воспроизводит одинаковую долю объектов, не 
изменяющуюся от предъявления к предъявлению. Третья ситуа- 
ция: доля запоминаемых и правильно воспроизводимых объектов 
изменяется направленно, например увеличивается от попытки к 
попытке. Эти ситуации можно формализовать в виде цепей собы- 
тий, которых здесь всего два — воспроизвел (В) или не воспроизвел 
(В) испытуемый предъявленные на k-m шаге объекты, но цепи и 
результаты разные. 

Первая ситуация моделируется цепью Бернулли. Например, 
если среди 30 предъявленных испытуемому вначале объектов ему. 
знакомы 3 объекта и он может их правильно воспроизвести, а 
остальные 27 объектов он не знает и без длительного изучения 
воспроизвести не может, то частоты и частости результатов не- 
скольких предъявлений будут, как показано в табл. 1.11. Здесь, 
действительно, все безусловные и условные распределения равны, 
так как Ру = Py = P2 = Ps = (0,9B, 0,1B), а в переходной матрице 
условные вероятности сохранить состояния равны единицам (это 
достоверные события), но условные вероятности перейти в проти- 
воположное состояние равны нулям (поскольку это невозможные 


Таблица 1.11 


Распределение частот и частостей после начального и следующих 
трех предъявлений шагов к примеру 1.12 


в данной ситуации события); так что 


Е: 
> 


1,0 0,0 

0,0 1,0/° 

Отсюда получаем подтверждение пригодности бернуллиевской 
цепи для моделирования первой ситуации: 


Pro = Pap = Ру = В ( 


8 в 1,0 0,0 
РР Рио = (0,9 1,0) (is 1) = 


=f ape bn 
~ ("01-00 ° 0,1-1,0 


Вторая ситуация может моделироваться простой цепью 
Маркова. При начальном предъявлении объекты неизвестны, 
и безусловное начальное распределение частостей — это Py = 
(1,08, 0,08) (табл. 1.11). Но в процессе первого перехода из не- 
воспроизведенных объектов воспроизводятся 21 и остаются невос- 
произведенными 9 объектов, т.е. переходные частости составля- 
ют Pag = 0,3 4 Pag = 0,7. Если учесть, что воспроизведение 
объекта — достоверное событие и не забывается в течение экспе- 
римента, то переходные вероятности при условии В снова равны 
соответственно нулю и единице. Таким образом, первая переход- 
ная матрица в целом такова: 


в в 
= (0,9 0,1). 


Отредактировал и опубликовал на сайте 


Используя эту матрицу, проверяем гипотезу о простой цепи Мар- 
кова. После первого предъявления получаем: 


в в 
0,3 0, 
ri=P-Pin= (10 0.0)-(92 97) = 
B 
3 


= (400 05 tposel= ( 
=\%0,0-0,0' *0,0-1,0)  \% 


Во время второго перехода из 9 оставшихся невоспроизведенны- 
ми объектов 6 воспроизводятся, а 3 остаются в прежнем состоя- 
нии. Следовательно, переходная матрица практически сохраняет- 
ся: Руб = 3/95 0,3, Руб = 6/9 = 0,7. Поэтому 


в 
03 0,7 
P2 =P Pay = Po Pryo = (оз ол) (93 1 = 
af 0,3-0,3 ete bs a 
=\%0,7-0,0° “07-107 \Ot 09) 


что соответствует данным табл. 1.11. При третьем переходе вос- 
произведены 2 из 3 оставшихся объектов, а переходная матрица, 
остается прежней (с округлением до десятых долей): 


что совпадает с данными табл. 1.11. Значит, можно считать про- 
стую цепь вполне удовлетворительной моделью для второй ситу- 
ации. 


Третья ситуация моделируется сложной цепью Маркова. Как 
показывают данные табл. 1.11, испытуемый по ходу предъявле- 
ний улучшает свои результаты: доля воспроизведений увеличи- 
вается, составляя при первом переходе 21/30 = 0,7, при втором — 
(28 — 21) :9 = 0,8 и при третьем — (30 — 28) : 1,0. Следователь- 
но, переходные матрицы изменяются от первого предъявления к 


третьему: 


Par = В (@ м 
В \ 0,0 1,0 
Вычисляя по 1.35 безусловные распределения, получаем в резуль- 
тале первого предъявления прежнее распределение: 
Py = Ро-Ри = (0,3,0,7); 
в результате второго — 


в в в в 
Р-Р: Pan = (03 ол). (13 = (0,06 0,94) 


и в результале третьего перехода — 
в в вв 
0.0 
Рз=Р: Ри = (0,06 0,94) + и] > (0.0 10). 


Сравнивая эти распределения частостей с приведенными в 
табл. 1.11, убеждаемся в адекватности сложной цепи как модели 
для третьей ситуации. 


{.4, КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ УПОРЯДОЧЕННЫХ СОБЫТИЙ 


14.1, Ранжирование событий по величине 


Если некоторое психическое явление обладает свойством, 60- 
лее или менее выраженным у разных людей, в различных жиз- 
ненных ситуациях и т.п., TO, пользуясь специальными экспери- 
ментальными приемами, разработанными в психологии*, можно 
упорядочить проявления данного свойства по степени выраженно- 
сти— по величине. Тогда проявление некоторой величины интере- 
сующего нас свойства может рассматривалься как событие и при- 
том случайное событие. А множество таких событий, образующее 


*См., напр.: Решлен М. Измерение в психологии// Экспериментьльная 
психология/ Под ред. П. Фрессь и Ж. Пивже, М., 1966; Грин Б.Ф. Измере- 
ние установки// Математические методы в современной буржувзной социо- 
логи] Под ред. Г.В.Осипова. M., 1966. 
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полную группу относительно области проявления рассматривае- 
мого свойства (от минимума до максимума), составляет систему 
упорядоченных событий. 

Система упорядоченных событий отличается от рассмотренных 
в предыдущем изложении тем, что может быть геометрически изо- 
бражена на оси, как показано на рис. 1.12. Однако упорядочивание 
только на основе оценок «больше — меньше» не дает еще никакой 
числовой определенности. Числовая определенность достигается 
ранжированием, т.е. приписыванием баллов (или рангов) у; собы- 
тиям z;. В качестве баллов используются 0 и числа натурального 
ряда — 1,2,3 и т. д., причем не только положительные, но и отри- 
цательные*. При ранжировании заменяют неизвестные и обычно 
неравные интервалы между значениями упорядоченной перемен- 
ной Х равными интервалами Л = и-1 — и между баллами У, как 
это показано Ha рис. 1.13. Очевидно, что такое «уравнивание» ин- 
тервалов семантически фиктивно. Но формально это допустимое 
приближение, так как матемалически ранжирование эквивалентно 
линеаризации: нелинейные приращения Аз; переменной X заме- 
няются линейными приращениями Ду; переменной У. 


— хх 


Zo ty % 25 т: п, In 


Рис. 1.12. Система упорядоченных событий. 
Х — изучаемое свойство; г, —его проявление (i = 0, 1, 2,..., 
п-1 п, причем zi41 > г: при всех i). 


Часто упорядоченная переменная выражается через сумму бал- 
лов, «набирасмых» испытуемым в результате выполнения груп- 
пы заданий. Причем, если каждое задание оценивается по двух-, 
трех-, пяти- и вообще &-балльной шкале, то сумма баллов У может 
принимать значения в пределах: 


O<Y <¢km, 


где & — максимально возможное количество баллов в шкале; m— 
количество заданий в группе. В этой ситуации, типичной для 
большинства отраслей психологии, изучающих объекты более 
сложные, чем явления сенсомоторики, суммы баллов уже могут 
не образовываль равных интервалов в конкретном исходе опыта. 


*Строго говоря, ранги всегдь положительны. Отрицательные ранги — 
это центральные отклонения, результат центрирования ранжированной 
переменной. 


Рис. 1.13. Ранжирование системы упорядоченных событий, 
У баллы (ранги); у, — равноотстоящие значения баллов. 
Остальные обозначения, как на рис. 1.12. 


Тогда формальное уравнивание интервалов достигается группи- 
ровкой исходных сумм баллов в классы длиной А, где A обычно 
больше или равно 2. 

Выбор классового интервала А и определение границ пере- 
менной суммы баллов У состоит в следующем. Пусть Ymin — 
минимальное, а Ymax — максимальное значения У. Тогда 


As ant [аа (1.37) 
Ау 

где ^— классовый интервал, ant— обозначение ближайшей целой 
части, Ay — натуральное число, причем обычно необходимо, что- 
бы А, > 8 (насколько позволяет количество наблюдений). За- 
тем выбираются границы классов (и). Первая (нулевая) граница 
Ti < Ин, для того чтобы Ymin Не оказался за пределами классифи- 
кации. Аналогично требуется, чтобы граница последнего класса 
1+1 > Ушах. Конкретные значения классовых границ, начиная со 
второй, определяются последовательно по формуле 


ин=и+А, 


rie i = 1,2,...п+1. В результате переменная сумма баллов У 
снова изображается в равных интервалах А (но Л # 1) на числовой 
оси, как на рис. 1.13. 

Наряду с границами классов при группировке данных исполь- 
зуются средние значения классов. Эти значения — обозначим их 
и„— определяются, если выбраны границы классов* и, по урав- 
нению 


wi = 4 +0, 54, 


1,2,...,.n для wy. 


raei=1,2,....n+lanayni 


“Bo многих случьях сначала выбирают м, например когда 0 баллов же- 
лательно сделать началом отсчета. Тогда границы определяют исходя из 
средних эначений интервалов: 4 = мл — 0,5 и 541 = uj + 0, 5%. 
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Каждому значению балла yj (или uj) как случайному собы- 
тию соответствует вероятность (частота, частость) его появления. 
Пусть на оси абсцисс отложены значения баллов Yi41 > и (для 
= 1,2,...,n +1), тогда каждому интервалу значений перемен- 
ной суммы баллов У’ соответствует вероятность Р(и < У < visi); 
которая геометрически может быть представлена площадью пря- 
моугольника с основанием A и высотой f(Y): 


Р(и ЗУ < и1) = ДУ). 


Фигура, образованная такими прямоугольниками, расположен- 
ными вплотную друг к другу на плоскости, называется гистограм- 
мой распределения вероятностей (частостей, частот) ранжирован- 
ной системы упорядоченных событий. Гистограмма при Л = 1 
изображена на рис. 1.14, а. На основании выполнения неравенства. 
ш+: > и значения баллов и при любых i на оси абсцисс фикси- 
рованы не произвольно, как это имело место для системы класси- 
фицированных событий. Поэтому в отличие от диаграмм распре- 
деления, рассмотренных выше, гистограмма распределения имеет 
конфигурацию, зависящую от ординат /(У) и классового интер- 
вала A, но не допускающую перестановок «столбиков» на оси аб- 
сцисс. 

В отличие от системы классифицированных событий систе- 
ма упорядоченных событий характеризуется тем, что изучаемое 
свойство Х —это по существу непрерывная латентная перемен- 
ная, которая лишь в силу обстоятельств представлена в виде ряда. 
дискретных значений*. Поэтому следует ожидать, что и вероят- 
ности значений 2; переменной Х должны изменяться непрерывно, 
а не «скачками», как на гистограмме. В этой связи более удобной 
плоской фигурой для геометрического изображения вероятности 
появления баллов на интервале A является прямоугольная тра- 
пеция, равновеликая прямоугольнику гистограммы (рис. 1.14, а). 
Обозначив ординаты сторон такой трапеции как f(y) и /(\+1), 
где yi и yi41 — абсциссы интервала А, очевидно, получим площадь 
трапеции, изображающую вероятность 


Р(и ЗУ < wisi) = 0, 5[F (yi) + Дин)», 


где Р(у; <У < и+1) — вероятность появления баллов на, интерва- 
ле А 


*Непрерывной называется переменная, принимающая на бесконечно ма- 
пом интервале бесконечно большое число значений. Дискретная переменная 
нь конечном интервале имеет конечное число значений. 


а as 
Puc. 1.14. Гистограмма, полигон (a) и кумулять (6) распре- 

деления оценок вероятностей ранжированной системы упоря- 

`доченных событий (по данным табл. 1.12). 

По оси абсцисс — баллы, по оси ординат — частости. 01,02, 9 — 

первый, второй и третий квартили 


Фигура, образованная такими трапециями, расположенными 
вплотную друг к другу на плоскости У, f(y), называется лоли- 
гоном, или многоугольником распределения (рис. 1.14, а). По- 
лигон распределения более точно выражает изменение вероятно- 
стей значений упорядоченной непрерывной переменной, чем ги- 
стограмма. Но в результате группировки экспериментальных дан- 
ных обычно сначала получают гистограмму. Чтобы построить по 
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тистограмме полигон, нужно соединить отрезками прямых линий 
середины верхних граней соседних прямоугольников гистограм- 
мы. А чтобы площадь полигона равнялась площади гистограммы, 
нормированной к единице, — 


Ури <¥ < ws) =1, 


надо середины верхних граней крайних слева и справа прямо- 
Угольников гистограммы соединить отрезками прямой с точками 
Ynin — ЛИ Ymax + Л на оси абсцисс, заменив тем самым крайние 
прямоугольники на равновеликие треугольники (рис. 1.14, а). 

Наряду с вероятностями появления значений на отдельных фик- 
сированных иктервалах наблюдений большое значение имеет ве- 
роятность того, что ранжированная переменная не превзойдет од- 
ного из возможных значений: 


PY <=> Pw <Y <u), (1.38) 


где у — yi-1 = А; — интервал группировки, a wy; — среднее значе- 
ние этого интервала. Если величина А; такова, что исследователя 
может интересовать промежуточное значение yy; < Ww < и, TO 
формула (1.38) уточняется: 
Yor 
Р(У < yj) = У Р(и-1) +5P(u), 


где 6 = (y; — yi-1) : (и-и-1) представляет собой долю интер- 
вала №. В случае одинаковых интервалов группировки удобно 
отождествлять у; и wi; тогда 6 = 0,5 и формула интегральной ве- 
роятности принимает вид 


у, 
Р(У <u) = D> Р(и-1) + 0,5P(y), (1.39) 
Yoni 
где yo = и; средние значения интервалов группировки. По 


этой формуле обычно и рассчитывают из частостей гистограм- 
мы линию накопленных частостей, которая называется кумулятой, 
или интегральной функцией распределения (рис. 1.14, 6). Напри- 
мер, пусть распределение частостей гистограммы (или эмпири- 
ческая дифференциальная функция распределения) задано значени- 
ями Р(у) = (0,02, 0,05», 0,15уз, 0, З0уа, 0, 25ys, 0,15, 0, 05y7, 
0, 03yg), так что условие нормировки выполнено (табл. 1.12). Вы- 
числим значения кумуляты по уравнению (1.39): P(Y < Yi) = 
0,0+0,5.0,02 = 0,010, Р(У < ур) = 0,02+0,5-0,05 = 0,045, 


Р(У < ys) = 0,02+0,05+0,5-0,15 = 0,145,..., РУ < w) = 
0,02+0,05+ ---+0,15+0,5-0,05 = 0,92 + 0,025 = 0,945, P(Y < 
vs) = 0,92+0,05+0,5.0,03 = 0,985. Объединяя результаты во 
множество значений кумуляты, получим: Р(У < ys) = (0,010,,, 
0,045,,, 0, 145y,, 0,370у., 0,645, 0,845y, 0,945y,, 0,985y,). Заме- 
тим, что оставшиеся 0,5-0,03 = 0,015 долей, которые приходятся 
на интервал A справа от абсциссы уз, дополняют кумуляту до еди- 
ницы, как это видно из табл. 1.12. 


Таблица 142 
Частости гистограммы, кумуллты и полигона к рис. 1.14 


Гистограмма | Кумулята | Полигон 
Ру.) Ply < и) | Ply +0,5) 

0 0,00 0,000 
0,010 

1 0,02 0,010 
0,035 

2 0,05 0,045 
0, 100 

3 0,15 0,145 
0,225 

4 0,30 0,370 
0,275 

5 0,25 0,645 
0, 200 

6 0,15 0,845 
0,100 

7 0,05 0,945 
0,040 

8 0,03 0,985 
0,015 

9 0,00 1,000 
>, 1,00 - 1,00 


По кумуляте легко вычисляются значения полигона, приходя- 
щиеся на интарвалы y+) — и. Они определяются разностью соот- 
ветствующих значений кумуляты: 


Р(ичов) = Р(У < ин) -Р(У < и), (1.40) 

а также полусуммами соседних частостей гистограммы: 
Р(и+0,5) = 0,5 [Р(\) + P(w4)]- (1.41) 
Отсюда правые части уравнений (1.40) и (1.41) должны быть рав- 


ны: 
Р(У < ин) — Р(У < и) =0,5[Р(и) + Р(и+!]], 


что может служить для проверки безошибочности расчетов куму- 
ляты и полигона по гистограмме. 

Итак, распределение вероятностей ранжированной системы упо- 
рядоченных событий может быть задано мультимножеством, обыч- 
ной таблицей и графически в двух основных и функционально вза- 


имосвязанных формах; дифференциальной — гистограмма, поли- 
гон и интегральной — кумулята. 
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Независимо от способа и формы задания, распределения веро- 
ятностей баллов У упорядоченных переменных X различаются, 
во-первых, положением на числовой оси (рис. 1.15, а), во-вторых, 
рассеиванием значений переменной (рис. 1.15, 6) и, в-третьих, асим- 
метрией (косостью, скошенностью) рассеивания значений пере- 
менной (рис. 1.15, в). Степень выраженности этих трех свойств как 
по отдельности, так и в сочетаниях зависит от специфики упорядо- 
ченной переменной X, а также от условий, в которых она эмпири- 
чески изучалась. Пользуясь количественными характеристиками 
указанных свойств, психолог получает возможность сравнивать 
психические явления у разных людей и в различных условиях. 
Иначе говоря, поскольку распределения вероятностей характе- 
ризуют конкретные упорядоченные психические переменные, то, 
сравнивая распределения, опосредованно сравнивают психиче- 
ские переменные. 

Количественные (числовые) характеристики свойств ‘распреде- 
ления вероятностей ранжированной переменной определяются на. 
основе квантилей. Кеантилем называется значение переменной, 
отделяющее от распределения «слева» или «справа» определен- 
ную долю объема совокупности. Если объем совокупности (пло- 
шадь гистограммы или полигона) положен равным единице, то 
квантиль — это значение у; переменной Y, для которого задана ве- 
роятность 

РУ < и) либо РУз и) =1-Ру<и). 
Среди квантилей, имеющих огромное значение в математической 
статистике, обычно используются квартили, децили и центили. 
Квартили делят совокупность на четыре части, поэтому их все. 
го три. Децили делят совокупность на десять частей, их девять. 
Центили отделяют от совокупности по 0,01 части, их 99. 

Jina распределений упорядоченной переменной используются 
преимущественно квартили. Именно через квартили определяют- 
ся в этом случае числовые характеристики положения, рассеива- 


Puc. 1.15. Свойства распределения вероятностей ранжиро- 
ванной переменной. 

«— положение, 6— рассеивание, «— асимметрия. По оси аб- 
сцисс — Gana, по оси ординьт — веролтности. 


ния и асимметрии. Первый квартиль Q, отделяет слева 0,25 объ- 
ema совокупности. Второй квартиль Q2 делит совокупность на две 
равные по объему части (по 0,5),oH называется медианой. Нако- 
нец, третий квартиль Qs отделяет слева 0,75 объема совокупности 
и справа 0,25 объема (см. рис. 1.14, 6). 

Вычисляются квартили по полигону или кумуляте, заданным 
графически либо таблично. Если переменная Х ранжирована по 
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возрастанию (2:41 > т;, соответственно и > Yi), то вычисления 
проводятся «слева — направо» по следующим формулам: 


п 1 
= AQ) +2 (1-54) от, 
2 
9: = A(Q2) +2 (5 - Su) Hey’ (1.42) 
3n 1 
Qs = 4) +a (32 - sy) joy 
где Qi —i-it квартиль; A(Q1)— начало классового интервала, в ко- 


тором находится 1-й квартиль; А — классовый интервал; п — объем 
совокупности в частотах (п = 1, если используются частости или 
вероятности); $д — сумма частот (частостей, вероятностей) клас- 
сов, предшествующих тому классу, где находится #-Й квартиль 
(Sa = PLY < A(Qi)))i £(Q:)— частота (частость, вероятность), co- 
ответствующая классу, где находится {-Й квартиль. 

Если переменная Х ранжирована по убыванию (пы < 2 HO 
Viti > и), то вычисления проводятся «справа — налево» по фор- 
мулам 


9. = 89) 2 (3 - sa) то 


4 £(Q1)' 
ah 1 
5 - Sa) Han’ (1.43) 
Qs = B(Qs) -d G a) Fay 


Здесь В(@;) — «конец» класса, где находится i-tt квартиль; Sg — 
сумма частот (частостей, вероятностей) классов, следующих за 
классом, где находится 2-Й квартиль; остальные обозначения те 
же, что и в формулах (1.42)*. 

Мерой положения распределения вероятностей ранжированной 
переменной является медиана (Ме = ()2). Для симметричных рас- 
пределений медиана совпадает с модой, для асимметричных не 
совпадает. Медиану рассматривают как центр рассеивания зна- 
чений ранжированной переменной. 

Приближенной мерой рассеивания является размах распределе- 
ния. Это область существования (или экспериментального опре- 
деления) ранжированной переменной. Очевидно, чем больше раз- 
мах, тем больше и рассеивание значений относительно медианы, 
Однако при одном и том же размахе рассеивание значений может 


*Отметим, что формулы (1.43) можно использо 
<лений по (1.42). 


для проверки вычи- 


быть более или менее «кучным». «Чувствительной» мерой рас- 
сеивания является полуинтерквартильное (вероятное, срединное) 
отклонение. Оно определяется как половина интервала рассеи- 
вания, включающего медиану, которому соответствует половина. 
объема совокупности, т.е. 


Е=0,5(@з - @:), (1.44) 


где Е— полуинтерквартильное отклонение; Qs и О, —третий и 
первый квартили. Для симметричных распределений (рис. 1.15, а 
и 6) 

Е=Ме- 0, = Qs— Me, 


а для асимметричных распределений (рис. 1.15, в) 


Ме- 09: # Q3 — Ме. 


На этом и основана количественная оценка асимметрии расиреде- 
ления. 

Мерой асимметрии является квартильный коэффициент асим- 
‚метрии As(Q), который определяется по формуле 


As(Q) = (9, + Qu —2Me), (1.45) 
где —1 < As(Q) < 1. Из уравнения (1.45) нетрудно установить, 
что для симметричных распределений As(Q) = 0 (рис. 1.15, a, 6), 
При скошенности влево Аз(0) > 0, я при скошенности вправо, на- 
оборот, As(Q) < 0 (рис.1.15, в). Поэтому скошениость (асимме- 
трию) влево называют положительной, а скошенность вправо -- 
отрицательной* 

Пример 1.13. По одному из субтестов батарей Векслера (оте- 
чественный вариант) на выборке в 100 испытуемых получены сум- 
мы баллов (табл. 1.13). Осуществим группировку данных, опре- 
делим гистограмму, кумуляту распределения (в частостях) и его 
числовые характеристики. 

Для получения частостей гистограммы нужно упорядочить и 
сгруппировать эмпирические данные. Записанные в табл, 1.13, 
они по сути представляют собой развернутое и неупорядоченное 


*Необходимо отметить, что наряду с указанными мерами положения, рас- 
<еивания и асимметрии для раижироваиных случайных переменных прим=- 
ияются среднее арифметическое значение, дисперсия, стандартное отклоне- 
ние, коэффициенты асимметрии и эксцесса, рассматриваемые далее (см. 2.2). 
Допустимость их вычисления обосновывается, во-первых, тем, что упоряло- 
ченная система событий гомоморфно отображает непрерывную случайную 
величину, во-вторых, тем, что формулы етих мер представляют собой мо- 
потонно возрастающие преобрьзования, приемлемые для шкал порядка, и, 
жаконец, тем, что баллы (ранги) в результате линевризации (см. рис. 1.13) 
метрически определены. 
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Таблица 1.13 


(Суммы баллов к примеру 1.13 


мультимножество, которое надо упорядочить и свернуть. Для 
этого, просматривая таблицу, переписывают числовые значения 
по возрастанию их величины, начиная с минимального, причем 
одинаковые значения записываются рядом. В результате получа- 
ется так называемый вариационный ряд— упорядоченное по воз- 
растанию мультимножество данных; но оно еще находится в раз- 
вернутой форме: 5,5, 7,9,9,...,25, 25, 26. Залем количество одина- 
ковых значений записывается в виде кратностей — частот значе- 
ний. Таким образом, получается распределение частот баллов: 
F(Y) = (2-5, 7, 2*9,...,2.25, 26). Сумма частот здесь рав- 
на 100. Нормируя этой суммой частоты баллов, преобразуют 
распределение частот в распределение частостей гистограммы: 
P(Y) = (0,02-5, 0,01-7, 0,02-9,...,0,02-25, 0,01-26). Чтобы получить 
частости кумуляты по гистограмме, следует воспользоваться, как 
это было сделано раньше, формулой (1.39): 


Р(У<и) = [oon + 0,5 - 0,02) - 5, (0,02 + 0,5 - 0,01) - 7, (0,02 + 0,01+ 


а 5 
+0,5-0,02)-9,..., ( YS a +05 om) 25, (= Py +0,5- om) a = 


y=5 9=5 
= (0,010-5, 0,025 -7, 0,040.9,...,0,980. 25, 0,995 . 26). 


Пропущенные здесь значения любопытный читатель может вос- 
становить самостоятельно. 

Рассмотренный способ — наиболее общий и точный, но он тре- 
бует не менее пяти наблюдений, приходящихся в среднем на одно 
числовое значение вариационного ряда. В этом примере (100:22) 
меньше 5 наблюдений, поэтому необходимо чукрупнить» интер- 


вал, пользуясь уравнением (1.37) и данными табл. 1.13: 


26-5 
Увах = 26; a=ant{ 10 } 


Чтобы не распределять «граничные» частоты баллов между со- 
седними интервалами, выберем в качестве границ пары упорядо- 
ченных по возрастанию значений: 5 иб, Ти, ...,25 и 26 и выпол- 
ним группировку данных, используя пятеричную систему кодиро- 
вания событий и < У < шк и подсчитывая по кодам частоты 
баллов в каждом интервале, как это сделано в табл. 1.14. Лалее 
нужно вычислить частости гистограммы, потом кумуляты и сопо- 
ставить частости средним значениям интервалов, как это показано 
в табл. 1.15. Пользуясь этой таблицей и формулами (1.42), вычи- 
слим значения квартилей: Q, = 13,5 + 2(0,25 — 0,225) : 0,09 = 14; 
9: = 17,5 + 2(0,5 — 0,54) : 0,12 = 16,8; Qs = 19,5 + 2(0, 75 — 0,67) : 
0,14 = 20,6. 


5; 2. 


Yeain 


Табльце 1.14 
Группировка первичных данных из табл. 1.13 


Границы Частоты значений 
ити uw SY Suita 


рэ 100 


Таблица 1.15 
Частости гистограммы и кумуляты к примеру 1.13 


Средние |Гисто-|Кумулята| Средние  |Гисто-|Кумулять 
значения |грамма|Р(У < и+) | значения |грамма|Р(У < м) 
интервалов wi] P(w) интервалов ty 
5,5 0,02 | 0,010 17,5 
7,5 0,01 | 0,025 19,5 
9,5 0,07 0,065 21,5 
11,5 0,08 | 0,140 23,5 
13,5 0,09 | 0,225 25,5 
15,5 0,21 | 0,375 
x 1,00 | - 


Далее по формулам (1.14) и (1.45) вычислим полуинтерквар- 
тильное отклонение и квартильный коэффициент асимметрии: Е = 
0, 5(20, 6 — 14,0) = 3,3; As(Q) = (20,6+ 14,0—2.16,8):2-3,3 = 0, 15. 
Это значение коэффициента асимметрии показывает, что распре- 


деление баллов скошено в сторону значений, не превышающих ме- 
диану. 


144, Меры корреляции рангов 
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Две (или более) системы упорядоченных событий могут быть 
стохастически взаимосвязаны, подобно тому как это имеет ме- 
сто для системы классифицированных событий. Стохастическая 
связь в этом случае известна под названием ранговой корреляции. 
Она характеризуется степенью (теснотой) и направлением, кото- 
рые оцениваются для несгруппированных значений ранжирован- 
ных переменных. Пусть совместно наблюдаются упорядоченные 
переменные X; и X2, каждая из которых независимо ранжиру- 
ется*, соответственно получают два ряда значений баллов Y; и 
Yo. Если для каждой :-й пары значений ранги (баллы) полностью 
совпадают, то имеет место максимально тесная положительная 
связь. Если минимальные ранги одной переменной соответству- 
ют максимальным рангам другой (или наоборот), то имеет место 
максимально тесная отрицательная связь. В общем случае для п 
пар ранги у каждой 1-й пары могут отличаться на величину от 
0 доп- 1 при i = 1,2,3,...,n. Лля количественного выражения 
тесноты и направления связи ранжированных переменных У} и У» 
используются коэффициенты ранговой корреляции по Спирмену и 
Кендалу. 

Коэффициент корреляции рангов по Спирмену определяется сле- 
дующим образом. Если среди рангов каждой из переменных нет 
одинаковых (усредненных для «одинаковых» значений упорядо- 
ченной переменной X), то используется формула. 


(1.46) 


где p— ранговый коэффициент корреляции Спирмена; dj = Ро - 
yf — разность i-x рангов переменной У; и переменной Y2; n— 
количество сопоставляемых пар; i = 1,2, 3,...,п. 

Если среди рангов каждой (или одной) из переменных имеются 
одинаковые, причем возможно несколько групп одинаковых ран- 


Ранжирование выполняется независимо, но «в одном направлении» (по 
убыванию или по возрастанию) для обеих переменных. Правила ранжиро- 
вания те же, что и при ранжировании по вероятности. 


гов, то используется формула 


6 (Did + Ty, + Ts) 
= n(n? — 1) ы 


1 
т У -м) и T= pt ~ty,)i 
7 i 


р=1 (1.47) 


где Ty, = 


ty, — количество усредненных одинаковых рангов переменной У 
и ty, — количество таких рангов переменной У, в ]-й группе оди- 
наковых рангов; }— номер группы одинаковых рангов (см. при- 
мер 1.14). Наличие одинаковых рангов означает меньшую степень 
дифференцировки свойств упорядоченных переменных, предста- 
вляемых баллами Y; и Уз, следовательно, меньше и возможности 
оценить степень связи между ними. Для учета этого уменьшения 
в формулу (1.47) введены поправки Ty, и Ту,, в результате чего р, 
вычисленный по (1.47) при Ty, > биТу, > 0, всегда меньше, чем 
вычисленный по (1.46). 

Пример 1.14*. По данным анкетного обследования получены 
два ряда групп работников, упорядоченных в соответствии с инте- 
ресом к выполняемой работе (Yi) и по соответствию образования 
и работы (Yz). Определим, есть ли корреляция между этими пе- 
ременными. Процесс вычисления р по уравнению (1.46) ясен из 


табл. 1.16: 
___6-286,5 
p=1~ Tq? = 1) 
Однако у обеих переменных имеются группы одинаковых рангов 


(по две группы), поэтому целесообразно воспользоваться оценкой 
тесноты связи по формуле (1.47): 


=1-0,63 = 0,37 


Ty, = wie —5) + (23 — 2)] = 10,5; 


I 
Ty, = ql? —2)+ (2-2) =; 
6(286,5 + 10,5+1) 
14(142 — 1) 
Козффициент корреляции рангов по Кендалу имест несколько 
способов вычисления**. Наиболее простой из них состоит в сле- 


дующем. Одна из переменных ранжируется и записывается так, 
чтобы ранги возрастали. Лругая переменная ранжируется в том 


р=1- =0, 345. 


*Зьимствован из xn: Методика и техника статистической обработки 
первичной социологической информации / Под ред. Г.В.Осипова. М’, 1968. 
С.169. 

**См. Юл Дж. Э., Кендел М.Дж. Теория статистики. M., 1960. 
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Таблица 1.16 
Данные для расчета 
‘коэффициента ранговой корреляции по Спирмену 


же «направлении», после чего ее ранги, соответствующие рангам 
первой переменной, записываются рядом. Тогда коэффициент кор- 
реляции рангов Кендала определяется по формуле 


-1, (1.48) 


rae т— коэффициент корреляции рангов Кендала; 2; — количест- 
во рангов второй переменной, начиная с i + 1, величина которых 
больше, чем величина 1-го ранга этой переменной; { — номер (ранг) 
первой переменной, i = 1,2,...,n. 

Оба коэффициента ранговой корреляции изменяются в преде- 
лах: -1 <р<1и-1 < т< 1, по модулю характеризуя тесноту 
связи, а по знаку — ее направление. М.Кендал считает, что ут 
имеется ряд преимуществ перед р. Однако это сомнительно хо- 
тя бы потому, что в т не предусмотрена поправка на усредненные 
ранги, и применять его в этом случае затруднительно. Иногда 
используют приближенное соотношение между этими коэффици- 
ентами: т ^ 2/39, но следует помнить, что оно справедливо лишь 
для больших п, а также не очень малых и не очень больших зна- 
чений р. Очевидно, что эти ограничения слишком неопределенны. 


Пример 1.15. В результате анкетного обследования для де- 
вятнадцати важнейших видов оборудования, используемого судо- 
водителями во время вахты, получены два ряда ранговых оценок: 
«по важности» оборудования (У!) и «по частоте» его использо- 
вания (У2). Есть основания предполагать, что эти рялы взаи- 
мосвязаны. Лля проверки тесноты и направления связи вычи- 
слим коэффициенты ранговой корреляции по Спирмену и Кендалу 
(табл. 1.17). По формуле (1.46) определим 

ja 6-124 

e=*"~ 19091) 
Величина 2; получается следующим образом. Для 1-го ранга вто- 
рой переменной (частота, в табл. 1.17) из оставшихся п — { рангов 
подсчитываются те, которые больше i-ro по величине. Например, 
при i = 2 величина ранга частоты 4. Просматривая оставшиеся 
17 значений рангов частоты, видим, что 15 из них больше четы- 
рех, следовательно 22 = 15. Определив все Zj, суммируем их и 
вычисляем по (1.48); 


= 0,89. 


2-149 
0,5. 19(19-1) 
Сравнивая т и р, можно видеть, что действительно т < р, но при 
этом т = 0, 83р > 2/3p. 

Наряду с корреляцией рангов двух упорядоченных и ранжи- 
рованных переменных может рассматриваться корреляция рангов 
нескольких таких переменных. В общем случае № упорядочен- 
ных и ранжированных переменных Yi, Yo, ..., Ум, рассматриваемых 
совместно, образуют М№-мерную систему случайных ранжирован- 
ных величин. Если в такой системе значения каждой величины — 
это простые ранги, то можно оценивать, во-первых, корреляцию 
рангов между всеми парами переменных, а во-вторых, согласован- 
ность рангов всех переменных, вместе взятых. Парные корреля- 
ции рангов в №-мерной системе упорядоченных величин числом 
№(М-1) образуют матрицу коэффициентов ранговой корреляции 
(по Спирмену): 


т —1= 0,74. 


я (1.49) 


PiN P2N ЗМ 
где из-за симметричности корреляций (ij = ji) и максимальная 
корреляция каждой переменной с самой собой равна единице (по 
главной диагонали). Вместо р в матрице (1.49) могут использо- 
ваться коэффициенты т (по Кендалу). 
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Таблица 1.17 


Данные для расчета коэффициентов ранговой корреляции 
‘по Спирмсну и по Кендалу к примеру 1.15 


Код обору- Ранги 
дования а. | @ |2 
важность (i) | частота 

А т т [о [13 
5 2 4 |-2] 4] a5 
B 3 2 1] 1] 16 
г 4 6 -2 4 | 13 
a 5 3 2 4 | 14 
Е 6 5 1 1 13 
ж г 2 |557 
3 8 9 |-1] 1] 9 
и 9 15 |-6| 36] 4 
к 10 7 3 9 9 
л п и о o 6 
M 12 8 4| 16 7 
H 13 10 3| 9} 6 
о 14 14 о о 4 
п 15 17 -2 4 2 
Р 16 13 3 9 3 
© 17 16 УЕ: 
$ 18 18 о о 1 
У 19 19 о о о 
Суммы 0 [124 | 149) 


Лля оценки степени совместной корреляции в такой системе ис- 
пользуются коэффициенты согласованности. Один из них пред- 
ставляет собой модификацию коэффициента ранговой корреляции 
Спирмена: 


п м 3 
QN(Qn+1) 12% (> ) so 
(М-0@- N(W=1)ne? 1 |’ 130) 


где р— коэффициент согласованности по Спирмену; N — число со- 
вместно рассматриваемых ранжированных переменных; j — номер 
переменной (1 = 1,2,..., №); п = ymax — число ранжированных зна- 
чений, одинаковое для всех переменных и равное максимальному 
рангу; 1 < yj < п- ЕЙ ранг ]-й упорядоченной переменной; все 
обозначения поясняются табл. 1.18. 


Таблица 1.18 
Данные для расчета коэффициентов согласованности. 


Эксперты (3) 


8 
auaonel| a 
aasenele 
поннов| в 


Другой коэффициент согласованности (конкордации) предло- 
жен М. Кендалом и Б. Смитом: 
ут 


и (1.51) 


где 5 = ых у; — 0,5 (п +1), а остальные обозначения те же, что 
ив формуле (1.50). 

Заметим, что изменяются коэффициенты согласованности в сле- 
дующих пределах: —1 <7 <1H0< W < 1. Между обоими коэф- 
фициентами существует однозначная зависимость: 
МУ’ —1 

N-1 

Пример 1.16. В табл. 1.18 представлены ранги, полученные 
от трех экспертов, по отношению к одной и той же упорядочен- 
ной переменной. Спрашивается, в какой мере оценки экспертов 
согласованы? 

Вычислим р по формуле (1.50): 

waif 2230240) 12.747 
= - [8-06-0 33-0.686-0 
Вычислим W по формуле (1.51): 

12.85,5 
32.6620 
Проверим по формулам (1.52): 


и= SIA 9+1 и Ш= (1.52) 


Jeon 


W= = 0,54. 


и = 30,343 0+0=0,54. 


Если по уравнению (1.46) вычислить ко 
ы эффициенты ранговой 
корреляции по Спирмену между результатами, полученными ка- 
жлым из экспертов, то найдем значения py = 0,77, раз = —0,09 и 
р2з = 0,26, которые можно записать в виде корреляционной матри- 


цы (1.49). Заметим, что коэффициент cornaco} ежду. 
4 ванности м 
есть среднее арифметическое: =m 


ai #8 
B= 3 (р:з + pis + pas) = (0,77 — 0,09 +0, 26) : 3. 0,31. 


ГЛАВА 1 ‚ КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 
1.1, СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ РАСПРЕДЕЛЕНИЕ 


1.1.1. Случайная величина 
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Под величиной условимся понимать какое-либо физическое или 
психическое явление, которое относительно совокупности суще- 
ственных условий характеризуется совокупностью чисел. Если 
изменяющимся условиям соответствует совокупность одинаковых 
чисел, величину называют хонстантой. Если изменяющимся усло- 
виям соответствует совокупность чисел, изменяющихся по некото- 
рому правилу, то величину называют переменной. Если при одних 
и тех же (фиксированных) условиях величина — безразлично, кон- 
станта или переменная — принимает одно и только одно числовое 
значение, будем называть ее неслучайной. Если при фиксирован- 
ных условиях величина принимает различные числовые значения, 
заранее неизвестно какие, такая величина называется случайной. 

Случайные величины, так же как и неслучайные, могут быть 
дискретными (прерывными) или непрерывными. Это обстоятель- 
ство существенно для определения количественных характери- 
стик, поэтому сначала рассмотрим специфику дискретной и не- 
прерывной случайных величин. 

Дискретная случайная величина принимает всегда конечное мно- 
жество целочисленных значений на заданном интервале возможных 
значений. Это, например, такие случайные величины, как «коли- 
чество случаев», «количество людей», «количество единиц про- 
дукции определенного рода» и т.п. 

Непрерывная случайная величина принимает теоретически бес- 
конечное множество значений на любом, сколь угодно малом ин- 
тервале возможных значений. Это, например, такие случайные 
величины, как «время реакции», «объем памяти» (в битах), «ум- 
ственная одаренность» и т.п. Непрерывная случайная величина, 
при практическом использовании всегда квантуется, т.е. прибли- 
женно выражается в виде квантованной случайной величины. 


Квантованная случайная величина определяется уже не беско- 
нечным числом значений, а конечным числом обычно равных ин- 
тервалов №*, «внутри» которых переменная остается непрерыв- 
ной. В этой связи квантованная случайная величина, с одной 
стороны, похожа на дискретную, но с другой — все-таки остает- 
ся принципиально отличной от нее. 

(Сходство в том, что дискретная случайная величина Х 3a- 
дается конечной совокупностью возможных числовых значений 
21,22,....2....2п И квантованная случайная величина Х» зада- 
ется конечной совокупностью возможных числовых интервалов 
№, Аа... А. 

Принципиальное различие между этими величинами состоит 
в следующем. Значения 2; дискретной случайной величины — 
обязательно неотрицательные целые числа, так как они обозна- 
чают явления, для которых понятие «часть» («доля») не имеет 
реального смысла (например, выражения «полслучая» или «20,62 
человека» бессмысленны). Между парами значений дискретной 
случайной переменной существуют разрывы, поэтому не имеют 
смысла и разности 2;+1 — Zi, и любые части таких разностей: 
Тин —2:), rae a > 1. Наоборот, интервалы А; квантованной 
непрерывной случайной величины, адекватно отображая реаль- 
ность, непосредственно «переходят» друг в друга, так что конец 
интервала Л; есть в то же время начало следующего интервала. 
№+1 — непрерывность сохраняется. Благодаря этому имеют ре- 
альный смысл не только любые разности № = 2:41 — Zi, но и лю- 
бые, сколь угодно малые доли этих разностей 1A, (где 1 <а < о). 
Это, в свою очередь, позволяет теоретически сколь угодно точ- 
но интерполировать значения непрерывной случайной величины 
на основе изучения ее в квантсванной форме. Но принципиально 
неверно поступать так же с дискретной переменной. 


1.1.1, Распределение вероятностей значений случайной величины 


Рассмотрим сначала распределение вероятностей значений 
дискретной случайной переменной. Тот факт, что дискретная 
случайная величина принимает определенное числовое значение, 
можно рассматривать как случайное событие и характеризовать 
возможность его появления вероятностью (частотой и частостью). 
Тогда дискретную случайную величину Х можно определить как 
систему из п чисел 21,22, .. -+:2n, которые появляются с ве- 


В частности, при любом измерении 

; результат определяется лишь с точ- 
ностью до абсолютной ошибки измерения Az, т.е. если результат измере- 
ний 2: определен как x; + Az, то интервал квантования Л = 22. 


роятностями P;(21), Pa(22);---,Pi(zi)s-++) Pa(#n)- Совокупность Be 
роятностей P;(z;), сопоставленных значениям 2; (i = 1,2,.-.,n) 
дискретной случайной величины Х, образует ряд распределения 
вероятностей значений случайной величины. 

Ряд распределения — это функция, отображающая отдельные 
значения дискретной случайной величины на вероятности (часто- 
ты, частости) их появления. Этот ряд может быть представлен в 
виде мультимножества (см. 1.4.2) или в виде таблицы (табл. 21) и 
«палочковой» диаграммы (рис. 2.1, a). 


Tabanye 2.1 
Ряды распределения вероятностей значений 
дискретной случайной величины 


Знвчениях | Pala) | РАХ <=) | Значениях | P(x) | A(X < 2) 


= 0,05 zs 0,20 0,85 
2 0,15 x6 0,10 | 0,95 
3 0,35 = 0,05 1,00 
rs 0,65 Dia 1,00 - 
а 
05 
02 
af 
a 
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Рис. 2.1. Графическое представле- 
ние pana распределения (3) и куму- 
пятивного pana распределения (6). 
По оси абсцисс — значения 2 дис. 02 
кретной случайной величины X; по 
оси ординат —вероятности: (=) 9 
uw P(X <x) на 6. Zy 22 2; % Zs 2 1, 
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Другим способом выражения распределения вероятностей зна- 
чений дискретной случайной величины является кумулятивный 
ряд распределения. Кумулятивным рядом распределения будем 
называль совокупность вероятностей 


Е 
Р(Х < =ь) = ХОР) при k <n, 


сопоставленных значениям х; дискретной случайной величины Х 
(табл. 2.1 и рис. 2.1, 6). Так как множество возможных числовых 
значений дискретной случайной величины образует полную груп- 
пу событий, то полная вероятность для ряда. распределения равна 


единице: я 
УР) = 
i=l 


Рассмотрим далее распределение вероятностей значений кван- 
тованной случайной величины. Факт появления значения 2; кван- 
тованной случайной величины Х на i- м интервале Л; также можно 
рассматривать как случайное событие и характеризовать некото- 
рой вероятностью 


Ри < X <4 +i), (2.1) 


rae i = 1,2,...,4. Совокупность таких вероятностей (частот, ча- 
стостей), сопоставленная совокупности интервалов квантования 
непрерывной случайной величины, образует полигон распределе- 
ния или гистограмму распределения вероятностей значений кван- 
тованной непрерывной случайной величины. 

Наряду с вероятностью, выраженной в (2.1), важна вероятность 
квантованной случайной величине Х принять значение, меньшее 
или не большее, чем некоторое значение Zp; соответственно 


P(X < zx). 


Совокупность таких вероятностей 


сопоставленных совокупности интервалов квантования, образует 
кумулятивный полигон (или кумулятивную гистограмму) распре- 
деления вероятностей значений квантованной непрерывной пере- 
менной. 


Формально аналитическое, табличное и графическое предста- 
вления полигона, гистограммы и кумуляты для квантованной слу- 
чайной величины те же самые, что и для упорядоченной, ранжиро- 
ванной случайной величины. Но по существу наших сведений об 
этих величинах здесь имеются два важных отличия. Первое от- 
личие состоит в том, что интервал Л у квантованной непрерывной 
случайной величины может быть выражен любым действительным 
числом, а у ранжированной случайной величины классовый ин- 
тервал А — обязалельно целое число. Второе отличие (оно, кстати 
сказать, обусловливает и первое) состоит в том, что у квантован- 
ной случайной величины интервал \ точно определен по значению 
самой величины, тогда как у ранжированной случайной величины 
классовый интервал семантически фиктивен: он лишь приближен- 
но обозначает интервалы квантования, точные значения которых 
нам неизвестны. Указанные отличия позволяют гносеологически 
оправданно осуществить предельный переход от полигона, гисто- 
граммы и кумуляты квантованной случайной величины к монотон- 
ным функциям, в общем и явном виде выражающим распределения 
вероятностей значений непрерывной случайной величины. 

Чтобы перейти к распределению непрерывной случайной пе- 
ременной, рассмотрим «элементарную» трапецию* полигона рас- 
пределения, схематически изображенного на рис. 2.2. Площадь 
этой трапеции (на рисунке заштрихована) численно равна веро- 
ятности того, что случайная величина примет значение на интер- 
вале А: 

F(A = Pla SX S24 +), (2.2) 


где /'(2;) — средняя линия «элементарной» трапеции. 

Очевидно, что уравнение (2.2) не изменится, если уменьшать вы- 
соту трапеции Л и одновременно соответствующим образом уве- 
личиваль ее среднюю линию f'(z;): 


але 


где a > 0 — произвольная константа. Тогда, увеличивая констан- 
туав (2.3), уменьшаем интервал квантования \ до бесконечно ма- 
лой (но не нулевой) величины. В результате получаем некото- 
poe значение средней линии «элементарной» трапеции /(2+), с0- 
ответствующее бесконечно малому A и неизменной вероятности 
P(x, <Х < в +A). Это значение f(z;) будем называть meope- 
тической плотностью вероятности. Теоретическая плотность ве- 
роятности показывает «удельное количество» вероятности, при- 


P(x ¢ X Зы +), (2.3) 


“Аналогичные рассуждения возможны и для челементарного® прямо- 
угольника гистограммы. 
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f(z) 


F (zi) 


=z 
min a | Fmaz 


Puc. 2.2. Схематическое изображение полигоны распре- 
деления вероятностей квантованной непрерывной случайной 
величины. 

По оси абсцисс — значения 2 непрерывной случайной вели- 
чины Х; по оси ординат — значения плотности вероятности; 


изн + нах — область определения величины Х. Заштрихо- 
вана «олементарная» трапеция; А — интервал квантования и 


высота трапеции, f(z) — ее средняя линия. 


ходящесся на бесконечно малый интервал значений непрерывной 
случайной величины. 

Очевидно, что каждому из бесконечно малых интервалов кван- 
тования dz непрерывной случайной величины Х соответствует не- 
которое значение теоретической плотности вероятности f(z), а 
совокупности таких значений соответствует совокупность плот- 
ностей. Функцию, устанавливающую соответствие между беско- 
нечно малыми интервалами квантования dz и плотностями f(z), 
будем называть функцией плотности распределения вероятностей 
эначений непрерывной случайной величины, сокращенно — плотно- 
стью вероятностей, и обозначать f(r). Функция плотности, таким 
образом, это предел, к которому стремится ломанная линия, огра- 
ничивающая сверху полигон или гистограмму распределения при 
устремлении интервала квантования A к нулю*. 

Аналогичный предел можем получить и для кумуляты. Для 
этого нам, в сущности, необходимо найти сумму бесконечно боль- 
шого числа слагаемых, каждое из которых есть вероятность /(2)4х 
появиться значению 2 на бесконечно малом интервале 4х. Та- 


Важно отметить, что при dr = On P(x < X Cr+) = 0, как следует из 
формулы (2.2). Иньче говоря, в отличие от дискретной случайной величины 
для непрерывной случайной величины вероятность отдельного значения (a 
этому и соответствует dz = 0) равна нулю. 


кую сумму будем называть интегралом и записывать следующим 
образом: 


F(z)= ] Даа» (24) 


Функция F(x), удовлетворяющая уравнению (2.4), называется 
(интегральной) функцией распределения вероятностей значений 2 
непрерывной случайной величины X, сокращенно — функцией pac- 
пределения. Она показывает вероятность того, что случайная ве- 
личина будет меньше или не превзойдет одно из возможных зна- 
чений; соответственно 


F(z) = P(X <2). 


Очевидно, что все бесконечное множество значений непрерывной 
случайной величины образует полную группу событий. Поэтому 


Е(:) = Даг) = 1 
ты 
PAC Zmin + Tmax — область возможных значений случайной величи- 
ны Х. 

Интегральная функция распределения F(z) и плотность веро- 
ятностей /(=)— это две взаимосвязанные операциями дифферен- 
цирования и интегрирования формы теоретического выражения 
распределений вероятностей для непрерывных случайных вели- 
чин: 


Че = ле), Лем = Fe). 


Но для практики более важной является дифференциальная функ- 
ция распределения Р(г) : 


P(zi) = F(zigs) = Flas) = Дед, 
YD Pla) = Ра), Ин) = Pai): №. 125) 
7 


Эта функция уже рассматривалась для систем упорядоченных чи- 
словых событий в параграфе 1.4. Ее элементами служат вероят- 
ности (частости) появления значений случайной величины на ко- 
нечных интервалах группировки данных, в соответствии с форму- 
лой (2.2). Уравнения (2.5) характеризуют взаимную зависимость 
всех трех функций, которые аналитически выражают распределе- 
ния непрерывных случайных величин. 

Заметим, что эмпирическую плотность вероятности можно рас- 
сматривать как вероятность, выраженную в единицах интервала 


* 
ranzenseas Аналогично и вместо теоретической функции рас- 
ределения используется эмпирическая функция, в качестве кото- 


рой выступает кумулята. При этом интеграл ется 
как в уравнениях (2.5). а. 


1.1}, Основные свойства распределений 
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Как и для упорядоченных переменных, распределения вероят- 
ностей случайных величин (дискретных и непрерывных) могут от- 
личаться друг от друга положением на числовой оси (рис. 2.3, a), 
рассеиванием значений (рис. 2.3, 6), асимметрией (косостью, cKO. 
шенностью) рассеивания значений (рис. 2.3, в), а также эксцессом 
(выпуклостью, «кучностью» ) рассеивания (рис. 2.3, 2). 


é г 
t @ 3 | 1 
2 


Рис. 2.9. Основные crojicras распределения вероятностей случай- 
ной величины. 

По оси абсцисс — значения 2 непрерывной случайной величины Х; 
по оси ординат — плотности вероятностей f(z). «—кривые 1 и 2 
различаются только положением на числовой ос: 


— кривые Ги 
2 имеют одинаковое положение, но рассеивание меньше у кривой 
1; «— кривые различаются положением и асимметрией: кривая 
1 имеет положительную асимметрию, кривая Я— отрицательную, 
кривал 2 симметрична; г—кривые различаются по дисперсии и 
эксцессу, у кривой 1 эксцесс больше. 


“Из (2.5) очевидно следует, что при №; = 1, /(:) = Pi(zi < ХЗ +) 
плотность численно равна вероятности. 


Эти четыре свойства по отдельности и в комбинациях зависят 
как OT специфики случайной величины, так и от условий ее наблю- 
дения. Кроме того, будучи выражены количественно, эти свойства, 
являются параметрами большинства встречающихся на практике 
распределений. Поэтому, выбирая меры, количественно харак- 
теризующие положение, рассеивание, асимметрию и эксцесс, во- 
первых, можно сравнивать случайные величины по выраженности 
отдельных свойсть, а во-вторых, во многих случаях можно опре- 
делять в явном виде функции распределения. 

Меры, количественно характеризующие указанные четыре, а 
также и другие отдельные свойства распределения, обычно на- 
зываются его числовыми тарактеристиками (параметрами). 


1.1. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ 


1.1.1. Меры положения 


Мер положения много, но каждая из них преимущественно ис- 
пользуется только в определенных условиях. 

Мода, уже известная нам по системам классифицированных и 
упорядоченных событий, —это значение случайной величины, 
имеющее наибольшую вероятность появления. Мода служит един- 
ственно возможной мерой положения для существенно дискретной 
случайной величины. 

Для непрерывных случайных величин, имеющих «выпуклую» 
функцию распределения (см. рис. 2.3), мода определяется из усло- 
вия максимума функции: 


d 

qi) =0, 
@ 
272) <0, 


где /(=) — плотность вероятности, & f(z) — ее первая производная 
и г) ее вторая производная. 

Для квантованных непрерывных случайных величин с «выпу- 
клой» гистограммой за моду приближенно принимается среднее 
значение классового интервала Л. Более точно значение моды по- 
лучается по формуле 


= P,- Py 
мо (ЕР), (26) 
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где Мо— мода; 2; — начало модального класса; АХ — классовый ин- 
тервал; P; — вероятность (частота, частость) класса, предшеству- 
ющего модальному классу; Р.—то же для модального класса; 
Рз — то же для класса, следующего за модальным. 

Необходимо отметить, что среди распределений встречаются 
«унимодальные», у которых мода отсутствует (рис. 2.4, а), и поли- 
‘модальные, у которых две и более мод (рис. 2.4, 6)*. 


а 5 


Puc. 2.4. Унимодальные распределения (а, кривые 1,2, ха- 
рактеризуют разные типы таких распределений} и полимо- 
альное распределение (6). 

По оси абсцисс — значения непрерывной случайной величины, 
по оси ординат — плотности вероятностей. 


Медиана уже была рассмотрена применительно к распределе- 
нию вероятностей ранжированной случайной величины. Точно 
так же она вычисляется и для квантованной переменной. 

Для распределения вероятностей значений непрерывной слу- 
чайной величины медиана определяется из условия 


ме Emax 
Slz)de =| S(z)de = 0,5, 
Pain 'ме 
где Ме— медиана, Zmin>Zmax — границы области наблюдения (су- 
ществования) случайной величины Х; /(2) — ее плотность вероят- 
ности. 

Необходимо отметить, что для квантованных и непрерывных 
случайных величин медиана имеет ограниченное применение. А 
для дискретной случайной величины медиана вовсе неприменима. 

Только для квантованных и непрерывных случайных величин 
появляется возможность использовать в качестве мер положения 


*Полимодальные распределения Часто представляют собой композицию 
одномодальных распределений и получаются в результате нестабильности 
условий опыт: 
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средние значения: среднее гармоническое, среднее зрифметиче- 
ское, среднее квадратическое, среднее кубическое и так далее — 
срелнее т-йЙ степени, а также среднее геометрическое. 

Среднее гармоническое (Н) определяется для непрерывной слу- 


чайной величины как 
i= Г” f(z)dz 
M hes @ 


а для квантованной соответственно как 


1 ofl 
fol (2.7) 
= 


где Р— это сокращенное P; (2; < Х < xj +4), а все остальные 
‘обозначения прежние. 

Среднее арифметическое (М)* определяется для непрерывной 
случайной величины как 


та 


m= |" ef(z)dz, (2.8a) 
Sin 
а для квантованной соответственно как 
4 В 
1 
Ma yah или Ma SDA (2.86) 


где Р, — частости или вероятности, /; — частоты на интервалах A. 
Среднее хвадратическое (5) определяется для непрерывной слу- 
чайной величины как 


5= УГ” 2? (=)а=, (2.9а) 


а для квантованной как 


(2.96) 


Среднее кубическое значение (©) и среднее четвертой степени 
(9) определяются сходным образом: 


« [ em" Зак 


(2.10) 


*Ouens часто для среднего арифметического значения случайной вели- 
чины Х в литературе используются обозначения хо и 2. 


(2.11) 


Важно отметить, что из перечисленных средних основной мерой 
положения является среднее арифметическое значение. Среднее 
гармоническое используется как мера положения распределения 
частоты колебаний, а также скорости. Средние квадратическое, 
кубическое и четвертой степени используются при вычислении 
мер рассеивания, асимметрии и эксцесса. 

Среднее геометрическое (G) определяется для квантованной слу- 
чайной величины как 


(2.12) 


(2.13) 


где т;— средние значения интервалов квантования Aj; fj — час- 
тоты появления значений на {-х интервалах; Р; — вероятности 
(частости); [+ — обозначение произведения всех 2; при i 
ый 

Среднее геометрическое вычисляется только при положитель- 
ных 2; и используется, в частности, для определения эффективно- 
сти выполнения человеком последовательности рабочих операций 
и для оценки среднего эффекта тренировки. 

Логарифмируя (2.12) и (2.13), можно видеть, что логарифм сред- 
него геометрического 


1 О О 
logG = 5D filogz: орлов (2.14) 


— это среднее арифметическое (2.86) логарифмов значений кван- 
тованной переменной. 

В этой связи необходимо специально остановиться на понятии 
«среднее значение» (математическое ожидание). В теории веро- 
лтностей и математической статистике это понятие многоэначно. 
С одной стороны, это понятие обозначает меру положения. В та- 
ком смысле оно и употреблялось выше. С другой стороны, поня- 


тие «математическое ожидание» означает специфическую опера- 
цию, смысл которой выражается следующим образом: 


в Е k 
мм ть 1 yr ak= Dar 
iat ‘at a 


для квантованной переменной Z, принимающей не более п возмож- 
ных значений на k интервалах группировки, и 


M(z] = ] xa „На 


для непрерывной переменной 2, определенной на интервале (Zin = 
Zmax), причем сама переменная 2 может быть любой функцией 
(суммой, произведением, степенью и т.п.). Например, можно урав- 
нение (2.13) записать, используя знак олерации «математическое 
ожидание» (М[...]): 


k 
Mflog G] = У log 2; Pi. 
Е 

Наконец, имеется третье значение этого понятия, а именно: ма- 
тематическое ожидание как среднее арифметическое не любой, а 
генеральной совокупности. 

Отметим в заключение вопроса о средних, что между ними су- 
ществует следующее отношение порядка: 


@mn < Н<С<М<5$<6@<О< --- < 2пах. (2.15) 


2.2.2. Меры рассеивания 


Среди мер рассеивания наибольший интерес представляют раз- 
мах распределения и различные отклонения от мер положения. 

Размах распределения — это область наблюдавшихся значений 
случайной величины: 

d= шах — Zmin- (2.16) 

Для дискретных случайных величин размах является единственно 
допустимой мерой рассеивания. Но для непрерывных случайных 
величин он лишь приближенно характеризует рассеивание. На- 
пример, кривые на рис. 2.3 имеют одинаковый размах, но разное 
рассеивание. 


Среднее (арифметическое или абсолютное) отклонение для не- 
прерывной случайной величины определяется формулой 


b= | a jz—Melf(z)dz, 
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а для квантованной — 


Е 
6= > в -мр, (2.17) 


= 


где |z—M,|— абсолютная величина (модуль) отклонения значений 
2; случайной величины Х от ее среднего арифметического значе- 
ния Mz; P; = (=)4г — вероятность (частость) появления значений 
на {-м интервале квантования. Несмотря на простоту вычисления, 
абсолютное отклонение имеет ограниченное применение из-за ря- 
‘да трудностей его использования в теории статистики. 

Наиболее употребительной мерой рассеивания является стан- 
дартное (или среднее квадратическое) отклонение, определяемое 


как 
в; = МБ; |, (2.18) 


где величина D,, называемая дисперсией, вычисляется по уравне- 
ниям 


и (2-м, Де) 


В 


У: - Me)? 


isl 


соответственно для непрерывной и для квантоваиной случайных 
величин. 

Меньше распространено теоретически, но всегда используется 
практически другое определение дисперсии — как разности между 
квадратами среднего квадратического и среднего арифметическо- 
го значений: 

Dz = $2 — М2, (2.19) 


где $5, — среднее квадратическое, согласно уравнениям (2.9а) и 
(2.96); М: — среднее арифметическое значение, согласно уравне- 
ниям (2.8а) и (2.86). 

Дисперсия тоже является мерой рассеивания, что отображено в 
самом термине («дисперсия» и означает «рассеивание»). Однако 
там, где требуется учитывать качество (наименование) случай- 
ной величины, квадратическая мера, какой является дисперсия, 
неудобна. Тогда применяется стандартное отклонение. 

Следует указать, что для «не очень» асимметричных распреде- 
лений справедливо приближенное равенство, связывающее сред- 
нее арифметическое и стандартное отклонения: 


6 =0, 80. (2.20) 


Стандартное отклонение можно определить по аналогии с полу- 
интерквартильным отклонением как половину величины интерва- 
ла рассеивания значений 2 непрерывной (или кваитованной) слу- 
чайной величины Х, в пределах которого вероятность появления 
этих значений составляет примерно 2/3. Тогда между срединным 
отклонением (Е) и стандартным отклонением (0) имеется следую- 
щее количественное соотношение: 


E =0,674e. (2.21) 


Отметим, что срединное отклонение Е редко используется в на- 
стоящее время применительно к непрерывным (и квантованным) 
случайным величинам. 

В отдельных случаях для сравнения рассеивания разноименных 
случайных величин применяются безразмерные меры рассеивания. 
Одной из таких мер служит коэффициент вариации (вариативно- 
сти), предложенный К.Пирсоном, 

Козффициент вариации (У) определяется в долях или в процен- 
тах как отношение стандартного отклонения (а) к среднему ариф- 
метическому значению (М, ): 


LA 9 
V = Fr (100%). (2.22) 


Важно помнить, что этот коэффициент существенно зависит от 
M,. Поэтому его применение для цели сравнения ограничивается 
теми случаями, когда распределения имеют одинаковые начала 
отсчета и одинаковые по модулю средние арифметические. Иначе 
сравнение может привести к ложному результату. 


1.1.1, Меры асимметрии и эксцесса 


Наиболее употребительной мерой асимметрии для непрерыв- 
ных и квантованных распределений является коэффициент асим- 
Mempuu (Аз), определяемый как 


1 Так А 
= =- М.) /(=)4х 
=). ( le)” F(z) 

A=) yo 

= D(z -М,}зР, 

oi 

где обозначения уже известны. В отличие от квартильного коэф- 

фициента этот коэффициент асимметрии изменяется в пределах: 

—с0 < Ав < oo. При As = 0 распределение считается симметрич- 

ным (см. рис. 2.3, в, кривая 2), при As > 0 распределение имеет 

«скошенность влево» (там же, кривая /) и при Ав < 0 распределе- 

ние «скошено вправо» (там же, кривая 5). 


В качестве меры выпуклости (эксцесса) используется коэффици- 
ент эксцесса (Ex), определяемый как 


u [We =M.)*f(2)de—3 


= 
ale - М.Р - 3, 


—3 < Ех < <. 


За «начало отсчета» выпуклости распределений принято значе- 


ние коэффициента эксцесса для нормального закона распределе- 
ния, для которого Ех = 0. 


1.}. ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ПО ЭКСПЕРИМЕНТАЛЬНЫМ ДАННЫМ 


1.1.1, Исходные положения 
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При определении числовых характеристик изучаемой случай- 
ной величины по экспериментальным данным необходимо учиты- 
вать ряд обстоятельств. 

Во-первых, из числа указанных выше мер, характеризующих 
одно и то же свойство закона распределения, нужно выбрать ту 
меру, которая достаточно информаливна с точки зрения цели ис- 
следования, а также применима к изучаемой случайной величине, 
согласно ее специфике. Например, сравнивая двегруппы людей no 
рассеиванию некоторого изучаемого психического свойства, мож- 
но воспользовалься приближенной оценкой рассеивания с помо- 
щью размаха. Если размахи значительно отличаются, допустим, 
Ad = |4, —d2| > 1,5 или 2, то степень приближения к истинному от- 
вету велика и применение размаха в качестве меры рассеивания 
оправдано. В противном случае следует воспользоваться более 
точной мерой — дисперсией. Выше мы указывали, что для дис- 
кретной случайной величины, в сущности, применимы корректно 
лишь мода и размах. Этим обстоятельством часто пренебрегают, 
поступая с дискретной переменной как с квантованной. Это мо- 
жет быть допустимо в случае, когда, совместно рассматриваются 
‘дискретные и непрерывные случайные величины и целесообразно 
использовать одинаковый математический аппарат, но лишь при 
Условии округления окончалельных результатов (применительно 
к дискретной величине) до целочисленных значений. К. непрерыв- 
ной случайной величине можно применять все рассмотренные вы- 
ше меры, в том числе моду, медиану и размах, разумеется, если 


эти меры соответствуют задаче исследования. Наконец, в ряде 
случаев можно использовать вместо одного из средних значений 
другое, проще вычисляемое. 

Во-вторых, после того как нужная мера выбрана, следует подо- 
брать для нее вычислительную формулу, соответствующую мас- 
сиву экспериментальных данных и по возможности обеспечиваю- 
щую меньше субъективных ошибок при ее использовании. Дело в 
том, что большинство мер можно вычислять различными способа 
ми и наряду с «понятийными» формулами, приведенными выше, 
существует немало так называемых «вычислительных» формул 
В результате оказывается, что для маленького массива данных 
лучше один способ, а для большого — другой; при вычислениях 
вручную с помощью бумаги и карандаша также лучше один спо- 
соб, на арифмометре— другой, а при машинном счете (на ЭВМ) — 
третий. 

Важно подчеркнуть, что выбор необходимых мер и вычисли- 
тельных формул — это своего рода искусство, приобретаемое лишь 
на практике. 


111. Вычисление мер положения рассеивания асимметрии и эксцесса по несгруппированным данным 


Массив экспериментальных данных, составленный значениями 
2; случайной величины Х, где! = 1,2,...,п при 


№<80=100, (2.23) 


группировать не всегда имеет смысл. Учитывая статистическое 
определение вероятности, можно видеть, что при условии (2.23) 
нельзя получить устойчивые экспериментальные оценки вероят- 
ностей P(z;) или P(x; < Х < 24 +A;). Поэтому здесь не применимы 
мода, медиана и большинство «понятийных» формул для других 
мер, рассмотренных выше. 

Вычисление средниг значений в качестве мер положения здесь 
осуществляется в соответствии с общей формулой 


(2.24) 


из которой, придавая показателю A и переменной z разные значе- 
ния, можно получить все вычислительные формулы. 

Jina среднего гармонического значения, полагая в (2.24) й = —1, 
получаем 


a= т (2.25) 
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Jina среднего арифметического значения, полагая h = 1, получаем 


(2.26) 


(2.27) 


(2.28) 


(2.29) 


Наконец, для среднего геометрического значения, полагая h =|и 
заменяяв (2.24) все х; их логарифмами, получаем 


1 м 
logG DY log zi. (2.30) 
ist 


Кроме неравенств (2.15) существует приближенное линейное pa- 
венство, связывающее все степенные средние значения*: 
amy Arid 
Th =M+ м, 
где к — среднее значение h-it степени из числа рассмотренных с 
помощью формул (2.24) — (2.29), h = -1, 0, 1, 2, 3, 4,...; M— 
среднее арифметическое значение; 0 — дисперсия. Использова- 
ние равенства (2.31) имеет смысл для приближенной оценки одних 
средних через другие, проще вычисляемые, например через сред- 
нее арифметическое. Нужно при этом помнить, что использование 
равенства (2.31) ограничивается, во-первых, степенью асимметрии 
распределения, а во-вторых, величиной коэффициента вариации. 
Чем симметричнее распределение и чем меньше, рассеивание, тем 
точнее приближение формулой (2.31). 


(2.31) 


*Джини К. Средние величины. M., 1970. С.180; см. также: Яст- 
ремский B.C. Некоторые вопросы математической статистики. M., 1961. 
С.120. 


Вычисление мер рассеизания осуществляется, за исключением 
размаха, посредством мер положения: среднего арифметического 
‘и среднего квадратического значений. 

Среднее абсолютное отклонение вычисляется по формуле 


1 м 
yl Ml. (2.32) 
= 


Дисперсия вычисляется по формуле (2.19) как разность между 
квадратом среднего квадратического и квадратом среднего ариф- 
метического значений, а также непосредственно по формуле 


р 


1 м 
a De -M)?. (2.33) 
ist 


Стандартное отклонение (©) и коэффициент вариации (У) вычи- 
сляются соответственно по формулам (2.18) и (2.22). 

Вычисление мер асимметрии и axcyecca выполняется посред- 
ством средних: арифметической, квадратической, кубической и 
четвертой степени: 


= (62 — 35? 3 q 
As= op? 387M + 2M") (2.34) 


Ex = Pay — 403M + 6S*M? — 3M‘) —3, (2.35) 


где Аз— коэффициент асимметрии, Ех— коэффициент эксцесса, 
© — стандартное отклонение, О — дисперсия, М — среднее ариф- 
метическое, $ — среднее кнадратическое, O — среднее кубическое, 
О—- среднее четвертой степени. Кроме того, вычислить Аз и Ех 
можно непосредственно по формулам 


1 м 
48 = по Le —M)* (2.36) 
и м 
i 2 
Ex = yo? —M)*-3. (2.37) 


= 

Следует, однако, заметить, что для вычислений вручную пред- 
почтительнее формулы (2.19), (2.34) и (2.35), чем формулы (2.33), 
(2.36) и (2.37) соответственно, так как при расчете разности (zi-M) 
нередки ошибки. Тем не менее наилучший путь для получения 
верного результата — это вычисления двумя разными способами: 
совпадение ответов с приемлемой точностью гарантирует их пра- 
вильность. 
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Пример 2.1. Экспериментально определены скорости, с кото- 
рыми люди записывают цифры арабского алфавита (табл. 2.2)*. 
Требуется количественно оценить положение, рассеивание, асим- 
метрию и эксцесс распределения значений скорости записывания 
цифр по экспериментальным данным. 


Таблица 2.2 
Исходные данные к примеру 2.1 


Цифрь| Скорость | Пифрь| Скорость 


записи, 1/с, 2; записи, 1/с, 2; 
1 5,9 6 4,5 
2 3,1 7 2,8 
3 3,6 8 2,8 
4 3,4 9 2,9 
5 21 10 5,0 
ee 36,1 


„Ллявычисления оценок всех мер положения, рассеивания, асим- 
метрии и эксцесса, рассмотренных выше, нам потребуются, как 
это следует из формул (2.24)-(2.37), а также (2.18), (2.19) и (2.22), 
следующие величины: 2, 21,2}, 27} и 2}, а после вычисления 
ды seer чья: (zi -М), [zi = MI, 
(2; — M)?, (2; — М)З и (2; — M)*. Эти величины и разности должны 
быть oa leer noi=1, ря ., 10, после чего по соответству- 
ющим формулам рассчитываются оценки мер. Выполним расчет 
промежуточных величин и разностей (табл. 2.3 и 2.4). 


Пользуясь формулой (2.25) и суммой из второго столбца табл.2.3, 


вычислим среднее Е 


H= == = 3,31(1/c). 


Используя сумму из табл. 2.2 и формулу (2.26), вычисляем среднее 
арифметическое: 


3,61(1/c). 


Аналогично по формулам (2.27) — (2.29) и соответствующим сум- 
мам из табл. 2.3 вычисляем средние квадратическое, кубическое 
и четвертой степени: 


$= A 42, 69 3, 78(1/c), 


*Данные к примеру с некоторыми изменениями заимствованы из работы: 
Кандарацкова Н.М. Суходольский Г.В. Об эффективности и на- 
дежности олементарных вычислительных операщий/ / Экспериментьльныя и 
прикладная психология/ Под ред. Б.Ф. Ломова. Вып. 1. Л., 1968. 


Таблица 2.9 


Промежуточные величины, необходимые для расчета оценок 
мер положения, рассеивания, асимметрии и эксцесса 


3,02 [5,3813 [ 142,69 | 614,80 | 2853,90 


Таблица 2.4 
Степени разностей к примеру 2.1 


му [C= MP [ими 


5,29 | 12,167 | 27,9841 
0.25 | -0,125 | 0,0625 
0,00 0,000 | 0,0000 
0,04 | -0,008 | 0,0016 
2,25 | -3,375 | 5,0625 
0,81 0,729 | 0,6561 
0,64 —0,512 0, 4096 
0,64 | -0,512 | 0,4096 
0,49 | -0,343 | 0,2401 
1,96 2,744 | 3,8416 

12,37 | 10,765 | 38,6677 


т 

‘i 

тем, вы, оо), 
Ч= {152853 = 4, 11(1/¢) 


Наконец, по формуле (2.30) и se, Igz; из табл. 2.3, потенцируя 
результат, определяем среднее геометрическое: 


G = antilog { j5.3813} w 3,45(1/c). 
Можно видеть, что действительно средние значения различа- 


ются между собой, и если поместить среднее геометрическое ме- 
жду средним гармоническим и средним арифметическим, то отно- 
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шение порядка будет соответствовать указанному неравенствами 
(2.15). После того как будут вычислены оценки для мер рассеи- 
вания, мы еще раз вычислим все средние, пользуясь равенством 
(2.31). 

Характеризуя рассеивание значений скорости записывания 
цифр человеком, вычислим сначала среднее абсолютное откло- 
нение. Для этого, не обращая внимания на знаки, заново сумми- 
руем отклонения от среднего арифметического во втором столбце 
табл. 2. 


Здесь необходимо обратить внимание на To, что алгебраиче- 
ская сумма второго столбца в табл. 2.4, составляющая 0,1, прене- 
брежимо мала как по сравнению с суммой z;, так и по сравнению 
< суммой |1]. Теоретически, как мы покажем ниже, должно выпол- 
няться равенство 


N 
У -M) =0. 
ist 


Но практически из-за округлений это равенство становится при- 


ближенным, т.е. 
м 
Уи = M) xe, 
1 


где = — величина «второго порядка малости» (в десятки раз мень- 
ше, чем 0,2) « У: |1; - MI). Нетрудно убедиться в следую- 
щем: если бы в примере центральные отклонения вычислялись 
при М = 3,61, а не при округлении с недостатком (М = 3,6), что 
значительно упростило расчеты в табл. 2,4, то равенство суммы 
центральных отклонений нулю выполнялось бы точно. 

Вычислим далее дисперсию двумя способами. По формуле 
(2.19), используя полученные выше значения среднего арифмети- 
ческого и среднего квадратического, имеем 


= 14, 288 — 13,032 = 1,256. 


Подставляя сумму третьего столбца из табл. 2.4 в формулу (2.33), 
получаем практически тот же результат: 


р 
10 
По формуле (2.18) определим стандартное отклонение: 


в = |V/1, 237] 1,11. 


D= — 12,37 = 1, 237. 
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Можем теперь сравнить оценки 6 и с по приближенному равенству 
(2.20). Действительно, 
0,91 
тп = 0,8. 
Jlanee определим отношение 2 и по приближенному равенству 
(2.31) вычислим заново оценки остальных степенных средних: 


=1 
5 0, 34 = 3,27, 


С=3,61-0,5.0, 34 = 3,44, 
$ =3,61+0,5-0, 34 = 3,78, 
9 = 3,61 + 0, 34 = 3,95, 
9 =3,61+1,5.0, 34 я: 4,12. 


Сопоставим полученные оценки с результатами непосредствен- 
ных расчетов (табл. 2.5). Можно видеть, что использование равен- 


ства (2.31) не внесло сушественной погрешности в оценки разных 
средних. 


Таблица 2.5 
Результаты вычисления средних значений разными способами 


'Вычислено Ошибка. 


Среднее | непосредет- | посредст- | абсолютная | относительная 


венно — | вом М по (к величине, вы- 
формуле численной не- 

(2.31) посредственно), Ye 

H 3.31 3,27 0,04 1,2 

G 3,45 344 0,01 03 

M 3,61 - - 

$ 3,78 3,78 - 

© 3,95 3,95 

Q 4 412 0,01 0,2 


Сравнивая оценки значений средних разного вида, в частности 
оценку М = 3, 61(1/с) и оценку Н = 3, 31(1/с), необходимо отметить 
следующее. Как указывалось, для усреднения скоростей следу- 
ет использовать среднее гармоническое. Но если разница между 
Ним невелика (допустима, по мнению исследователя), то мож- 
но заменить Н на М. В данном случае эта разница составляет 


несколько менее 10%, и в первом приближении ею можно прене- 
бречь. 

Основываясь на среднем арифметическом значении в качестве 
центра рассеивания, вычислим двумя способами оценки для мер 
асимметрии и эксцесса. Оценку для коэффициента асимметрии 
получим по формулам (2.34) и (2.36), подставляя в них значения 
из табл. 2.5 и 2.4 соответственно: 


(61,48 3-14,27.3,6142-47,05) = i = 0,76, 


0. 
= 1,3731 1, 3731 
1 
AS = 0,165 = 0,78. 
Точно так же оценку для коэффициента эксцесса получаем по 
табл. 2.4 и 25 и формулам (2.35) и (2.37): 


Ех = 15085,39 —4.61,48.3,61+6. 14,269. 13,032 — 3 - 169, 833)— 


3,84 
—3 = 153 3% —0,49, 


1 . Ses 
Ex= 753. 1038, 6677 З= —0,47. 
Легко видеть, что оба способа приводят к одинаковым результа- 
там с ошибкой менее 5% 

Отметим, заканчивая пример, что рассматриваемая совокуп- 
ность скоростей записывания цифр имест небольшую положитель- 
ную асимметрию и незначительный отрицательный эксцесс. Учи- 
тывая погрешность центрирования (= = 0,1), можно практически 
считать совокупность симметричной и нормально выпуклой. 


111, Группировка данных и получение эмпирических распределений 


Важнейшей задачей при изучении психических и связанных с 
ними явлений служит получение их полных количественных опи- 
саний. Такие описания суть распределения вероятностей тех слу- 
чайных величин, которые получаются в результате подсчета ли- 
бо измерения свойств или признаков изучаемых явлений. В этой 
связи в эксперименте необходимо провести достаточно много из- 
мерений либо наблюдений изучаемого свойства или признака, для 
того чтобы статистически надежно оценить по эмпирическим ча- 
стостям вероятности значений случайной величины, отображаю- 
щей исследуемое свойство. Как было сказано выше, количество 
наблюдений либо измерений должно быть таким, чтобы большин- 
ство значений встречалось в эмпирических данных не менее пяти 
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раз. Это условие практически приводит к следующей оценке чи- 
сла необходимых наблюдений (измерений): 


N > 80+ 100. 


В отдельных случаях, при небольшом рассеивании данных, оказы- 
вается достаточным для предварительной оценки распределения 
№ > 50 - 80. 

Чтобы эмпирическое распределение адекватно отражало ре- 
альность, при группировке следует учитывать: с ‘дискретной или 
непрерывной случайной величиной мы имеем дело, большое или 
небольшое рассеивание данных получено, какова была точность 
измерений и многое другое. Группировка данных применительно к 
дискретной случайной величине не отличается в сущности от рас- 
смотренной в параграфе 1.4. Поэтому обратимся к особенностям 
группировки результатов измерений непрерывных случайных ве- 
личин, которые процедурой измерения преобразованы в кванто- 
ванную форму 

При достаточном числе измерений наилучшие результаты га- 
рантирует упорядочивание перестановкой рядов измеренных зна: 
чений с одновременной группировкой одинаковых значений и по- 
следующим подсчетом их частот и частостей. Практически вы- 
полняется следующая процедура. 

1. Из массива экспериментальных данных определим мини- 
мальное (2min) и максимальное (шах) значения, 

2. Полагая, что все наблюдавшиеся значения х получены в ре- 
зультате равноточных измерений с точностью Az, запишем возра- 
стающий ряд из k возможных значений: 


тии; Zmin + ДЕ; Ешь +241; ...; Хыш + (Е - 2)А2; Zmax, 


Где нах = Zmin + (k — 1)Ах и А — натуральное число. Отметим, 
что некоторые из возможных значений 2 (i = 1,2,...,k) среди экс- 
периментальных данных могут случайно отсутствовать, Отметим 
также, что К эквивалентно количеству интервалов группировки 
величиной Az: 1 


Е = <> (#max — Фвша) +1, 


Az 
и требуется, чтобы N > k, иначе группировка может He имеет 
смысла. Отметим, наконец, что при большом N высокоточных из- 
мерений (Аг мало) k оказывается столь большим (несколько сотен 
и более), что этот способ группировки неприменим и следует вос- 
пользоваться другим способом. 

3. Последовательно просматриваем массив экспериментальных 
данных и, кодируя их «палочками», как и прежде, подсчитываем, 
сколько раз фактически встречается каждое из k возможных зна- 
чений z;. Таким образом определяем частоты /#(1;). Очевидно, 


некоторые из возможных значений фактически могут и не встре- 
титься, и соответствующие частоты окажутся тождественно рав- 
ными нулю. 

Пример 2.2. В опыте по изучению амплитудно-частотной ха- 
рактеристики руки человека для одного из испытуемых получены 
значения амплитуды установившихся колебаний руки при слеже- 
нии за движущейся целью (табл. 2.6). Оценим по этим данным 
дифференциальную функцию распределения значений амплитуды, 
используя указанную процедуру группировки. 


Таблица 2.6 


Значения амплитуды установившихсл колебаний руки (ri, мм) 
к примеру 2.2 


1 2 3 4 5 6 р 8 
64 62 63 65 70 52 62 49 
72 52 55 70 64 66 65 59 
60 68 61 65 63 60 66 48 
67 72 45 58 65 75 55 52 
63 63 46 52 70 66 68 54 
65 66 64 56 65 67 62 42 
50 62 72 55 56 61 67 57 
75 67 70 60 58 70 57 51 
51 60 70 54 56 64 62 66 
80 68 63 59 65 п 62 51 
65 60 63 п 62 57 62 56 
62 60 62 63 73 68 60 55 
73 58 62 55 62 66 57 56 
62 57 68 55 60 53 60 54 
п 60 69 58 63 73 58 53 
63 64 п 66 68 63 62 41 
55 59 58 62 64 67 58 55 
56 64 60 82 60 62 52 54 
64 65 64 54 т 62 62 58 
61 60 70 74 61 66 61 51 
65 63 73 58 62 58 61 58 
69 59 52 55 55 66 67 62 
65 60 59 62 51 72 60 62 
68 58 54 75 44 п 53 я 
58 62 64 62 73 65 50 62 


Сначала находим в табл. 2.6 минимальное и максимальное 3Ha- 
чения амплитуды: Zmin = 41, шах = 82. Затем записываем упоря- 
доченные по возрастанию промежуточные значения: 41, 42, 43,..., 
81, 82, как показано в табл. 2.7. Просматривая числовой массив 
табл. 2.6, кодируем «палочками» (в пятеричном коде) повторяю- 
щиеся значения амплитуды и подсчитываем частоты значений, как 


Таблица 2.7 
Группировка данных из табл. 2.6 


i | =: мм | Кодирование | f, | i | и: мм | Кодирование А 
1) a |1 7 [22 cua 25 
2| 42 |1 1]23| 53 | ши u 
3] 43 ojj2a| 64 | TM 10 
4| 44 |1 1||25| 65 | ППШ 12 
5| 45 |1 1||26| 66 | ППШ 9 
6] 46 |I ajar] 67 | ut 6 
7| 47 ojj28} 68 | Ti т 
| 48 |1 1|129| 69 |П 2 
9] 4 |1 1 ||30| то | Ши 7 
10| so |1 11| т | ПИ 6 
a] м | Tr в |32| 72 |ПП 4 
12| 52 | ПИ 6 |33| 73 |ПП 5 
13| 53 | I 3 || 34| 74 |r 1 
14| 54 | TMT 6 | 35| 75 |Ш 3 
15| 55 | ПИШИ 10 || 36| 76 о 
16| 56 | ШИ 6 ||37| 77 Г 
м| 57 |Ш 5 || 38| 78 о 
18| 58 | Tun 13 ||39| 79 о 
19| 55 | Ti $140 | 80 |1 1 
20| во | ПИШИПИ |16]41| 81 о 
21| 61 Lm 6 || 42| 82 1 

=i 200 


это сделано в табл. 2.7. Оценивая итоги, можем видеть, что неко- 
торые из промежуточных значений в эксперименте не наблюда- 
лись, и распределение получилось «с разрывами». Следовалель- 
но, двухсот измерений оказалось мало для получения требуемо- 
го распределения. Необходима группировка данных в интервалы 
А> 1. 

Ллявыбора интервала группировки, не равного единице, следу- 
ет учесть, что количество интервалов должно составлять не мень- 
ше восьми, обычно — от восьми до двенадцати*. Поэтому в общем 
случае для квантованной случайной величины искомый интервал 
определяется по формуле 


А = (2max — Zmin) : (8 12). (2.38) 


Поскольку эта формула может привести к иррациональному А, 


*Величина интервала должна быть не меньше половины стандартного 
отклонения нормально распределенной случайной величины, большинство 
ний которой 
полуинтерквартильных отклонений (см. рис. 2.5 и формулу (2.21). 
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иногда его следует округлять, но так, чтобы 
А= А, 


где Дг — абсолютная погрешность измерений случайной величи- 
ны в условиях эксперимента. 
Границы 2; и средние значения Ww; интервалов выбираются либо 
исходя из условия 
2; ЗТьш, Tet 2 Tmax (2.39) 
где & — номер последнего интервала и 


па=н+А о ше +0,5A, (2.40) 


либо исходя из условия 


Ww, = Хит, Wk = Imax; 
и тогда 
m= - 0,5, щи=ш +, 
где: = 1,2,...й+1 для границ ui = 1,2,..., для средних значений 


интервалов. Оба эти способа выбора практически равноценны, но 
при сравнительно небольшом количестве данных (сотни, а не ты- 
сячи) лучше предпочесть первый из них, соответственно условиям 
(2.39) и (2.40). 

Продолжим теперь пример 2.2. Зададимся вначале десятью ин- 
тервалами и по уравнению (2.38) определим для гы = 41мм и 
Zmax = 82мм A = (82—41) : 10 =4,1(мм). Так как измерения ам- 
плитуд проводились с абсолютной погрешностью в полмиллиме- 
тра, округлим интервал с недостатком до Л = 4мм. По условиям 
(2.39) и (2.40) выберем: 21 = 40мм < тыш. Вычисляем осталь- 
ные границы и средние значения интервалов и записываем их, как 
это сделано в табл. 2.8. При этом шах = ил! и число интервалов 
оказывается на один больше, чем предполагалось вначале: 

Прежде чем перейти к группировке данных из табл. 2.6 в 
табл. 2.8, следует обратить внимание на одно обстоятельство. 
Среди эмпирических данных теперь необходимо выделить два 
подмножества значений: внутриинтервальные и граничные. Вну- 
триинтервальные значения должны быть сопоставлены средним 
значениям «своих» интервалов, а граничные — только «своим» 
границам. Но граница относится к обоим соседним интервалам. 
Поэтому частоты граничных значений необходимо делить попо- 
лам и суммировать эти половины с частотами соседних интерва- 
лов (табл. 2.8); таким путем обеспечивается несмещенность оце- 
нок частот из-за группировки данных. То обстоятельство, что в 
результате могут получаться дробные или смешанные числовые 


Таблица 2.3 


Группировка данных из табл. 2.6 в счетверенные интервалы; 
частоты и частости распределения амплитуд к примеру 2.2 


Границы | Средние "Частоты | Частости 
т, мм | значения | Кодирование hi Ps 
wi, MM | 
40 _ 
- 42 и 2,5 0,0125 
44 - 1 
= 46 и 3,0 0,0150 
48 - I 
- 50 ши 11,5 0,0575 
52 - ИТ 
- 34 TOM 10 TE TI 25,5 0, 1250 
56 - ши 
- 58 TOO TM 10 0 11 34,0 0,1700 
60 - TM EOL 
TA TD 0 Ln 
- 62 int 55,0 0, 2750 
64 = ИИ 
66 TAO LO LL LO оли 35,5 0,1775 
68 - ии 
- 70 TO 0 20,5 0,1025 
72 - uu 
- 74 пи 11,0 0,0550 
76 - 
- 78 0,5 0,0025 
80 - т 
= 82 1 1,5 0,0075 
84 - 
Суммы 200,0 1,0000 


значения частот, не должно смущаль: это связано с недостаточ- 
ным количеством измерений и могло бы быть ликвидировано при 
повышении точности и числа измерений. 

После того как частоты определены, следует вычислить часто- 
сти р. Лля этого необходимо определить объем совокупности 
после группировки (№): 


k 
N= Dh 


1 


где & — количество интервалов группировки, и затем вычислить 
частости 


(2.41) 


Дело в том, что при значительном количестве экспериментальных 
данных (несколько сотен и более) в процессе их разнесения по ин- 


тервалам отдельные значения — обычно из числа частых — могут 
быть случайно пропущены или закодированы дважды. Повторное 
разнесение данных не изменяет положения, так как допускаются 
новые ошибки. Сами по себе ошибки такого рода (1 — 2%) не вли- 
яют на полученное распределение. Но поскольку \' $ М, а требу- 
ется, чтобы Ч Pi = 1, частости вычисляются здесь по формуле 
(2.41). 

Заканчивая, нужно отметить, что не обязательно группировать 
‘данные в равные интервалы. Но они удобны для вычисления па- 
раметров распределения, особенно если значения случайной ве- 
‚личины в результате измерений включают в себя две или больше 
значащих цифр. 


114, Вычисление мер положения рассеивания асимметрии и эксцесса по эмпирическому распределению 
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Эмпирический ряд распределения вероятностей значений дис- 
кретной случайной величины в качестве меры положения имеет 
лишь моду, значение которой, если она существует, непосред- 
ственно определяется по наибольшей частоте (или частости). В 
качестве меры рассеивания используется лишь размах, значение 
которого определяется теперь не формулой (2.16), а разностью 


Ч = 41 — 21, 


где 21+: — последняя, а 2, — первая границы ряда, определенные 
фактически наблюдавшимися, а не теоретически возможными зна- 
чениями изучаемой случайной величины. Следует помнить, что 
размах полигона (dy) всегда больше, чем размах гистограммы 
(4.), построенной на тех же самых средних значениях интервалов 
д: 4. > dr. 

Для квантованной непрерывной случайной величины все рас- 
смотренные выше меры положения, рассеивания, асимметрии и 
эксцесса вычисляются по любой из эмпирических форм закона 
распределения. Но меньше всего труда затрачивается при вы- 
числениях по эмпирической дифференциальной функции, предста- 
вленной в виде ряда средних значений равных интервалов груп- 
пировки (+) с сопоставленными этим значениям частостями (pj). 
Именно такой формой мы ограничили получение эмпирической 
функции распределения в результате группировки. Эта же форма, 
как будет показано в дальнейшем, является исходной для опреде- 
ления эмпирического, а затем и теоретического закона распреде- 
ления в виде некоторой монотонной функции. 

За исключением моды, медианы, среднего гармонического и 
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среднего геометрического значений, а также размаха, все рассмо- 
тренные выше меры вычисляются единообразно через так называ- 
емые моменты. Рассмотрим сначала исключения, а потом общие 
правила, 

Пример 2.3. В ходе экспериментального изучения характе- 
ристик человека при слежении за целью получено эмпирическое 
распределение значений полупериодов треморовидных колебаний 
руки одного из мастеров спорта по стрельбе (табл. 2.9). Требует- 
ся вычислить по распределению моду, медиану, а также среднее 
гармоническое и среднее геометрическое значения полупериодов 
таких колебаний. 


Таблица 2.9 
Эмпирическое распределение данных к примеру 2.3 
ара ме | ммс | pe | lew | ржи 
17,75+53,25 | 35,5 | 0,1960| 0,005521 | 1,5502 | 0, 303839 
53,25 88,75 | 71,0 | 0,3260 | 0,004592 | 1,8513 | 0,603524 
88,75 + 124,25 | 106,5 0,001615 | 2,0273 | 0,348696 
124,25 + 159,75 | 142,0 0, 000824 | 2,1523 | 0, 251819 
159,75 + 195,25 | 177,5 0,000332 | 2, 2492 | 0, 132703 
195,25 + 230,75 | 213,0 0,000216 | 2,3284 | 0, 107106 
230,75 + 266,25 | 248,5 0,000113 | 2,3954 | 0, 067071, 
266,25 + 301,75 | 284,0 0,000084 | 2, 4533 | 0,058879 
301,75 + 337,25 | 319,5 0,000038 | 2, 5044 | 0, 030083 
337,25 +372,75| 355,0 0, 000025 | 2, 5502 | 0, 022952 
372,75 + 408,25 | 390,5 0, 000017 | 2, 5916 | 0,016845 


408, 25 + 443,75 | 426,0 
Суммы | 


0, 000011 | 2,6294 
0,013388 | - 


0, 011832 
1,955319 


Mody вычислим по формуле (2.6). Начало модального класса 
1Мо = 53,25 мс. Классовый интервал Л = 35,5 мс. Частость мо- 
дального класса py = 0,326, частость предшествующего класса, 
Pi = 0, 196, а частость последующего класса рз = 0,172. 


0326—0196 \_ 

Мо = 53,25 + 35,5 im 0,196 — os) = 
0,130 

= 53,25 + 35,50 584 = 69,5 (мс) = 70 (мс). 


Медиану вычислим по формуле (1.42). Начало медианного клас- 
са A(Q2) = 53,25 мс. Сумма частостей предшествующих классов 
(такой всего один) S4 = 0,196. Частость, соответствующая меди- 


ane, равна 0,5. Частость медианного класса P(Qz) = 0,326. 


Ме = 53,25 + 35,5(0,5 — 0,196) 2 = 


0,326 
10,792 _ 
= 53,25 + Too = 93,25 + 33,1 = 86 (мс). 
Проверяя no формуле (1.43), убеждаемся, что Ме вычислена npa- 
вильно: 


1 
Me = = = ae | 
le = 88,75 — 35,5(0,6 — 0,475) зу = 86 (мс) 
Среднее гармоническое значение полупериодов колебаний вычи- 
слим по формуле (2.7), заменив 2; на м; и считая, что п = 12— 
количество интервалов группировки: 


Значения отношений 2 представлены в табл. 2.9, там же приведе- 

на их сумма 

= 1 

~ 0,013388 
Наконец, среднее геометрическое значение вычислим по форму- 

ле (2.14), снова заменяя z; на м; и считая п = 12 количеством 

интервалов группировки. Промежуточные величины Ig и; и р: Ig wi 

тоже приведены в табл. 2.9. Суммируя ori = 1 доп всер Ig ил в по- 

следнем столбце табл. 2.9, получаем 1,9553 — логарифм среднего 

геометрического. Потенцируя этот логарифм, находим 


С = 90,22mc 90 мс. 


Рассмотрим теперь с единых позиций вычисление всех осталь- 
ных мер положения, рассеивания, асимметрии и эксцесса. Для 
этого введем понятие моментов распределения. 

Jina непрерывной случайной величины общая формула момента 
№-й степени может быть записана следующим образом: 


н = 74,7 (мс) = 75 мс. 


ть 
моменть = [ zh f(z)de, (2.42a) 
ыыы. 
где \ — показатель степени (порядка) момента; х — отклонение 
значений случайной величины от некоторого начала отсчета; хина 
И шах — границы области определения случайной величины Х. 
Для квантованной непрерывной случайной величины, заменяя 
в (2.42а) интеграл суммой, «элементы» вероятностей f(x)dz— 
веролтностями P; появления значений 2; на конечных интервалах 


группировки А; и полагая, что 2;— это средние значения у ин- 
тервалов, получаем общую формулу моментов, которую будем ис- 
пользовать для всех расчетов при обработке экспериментальных 
данных: 


В 
moment, = )>z}P,, (2.426) 


где п количество, a i = 1,2,...,k — номера интервалов группи- 
ровки. 

Моменты различаются порядком (степенью) A и видом откло- 
нения 2;. Степень № может принимать любые знамения из неот- 
рицательных целых чисел. Соответственно различают моменты 
нулевого, первого, второго, третьего, четвертого, а также более 
высоких порядков. 

По виду отклонения выделяют начальные, центральные, основ- 
ные и абсолютные моменты. 

Начальные моменты определяются по отклонениям значений 
случайной величины от некоторого начала отсчета. Часто на- 
чальные моменты непосредственно вычисляют по значениям 1; 
случайной величины X, полученным в результате измерения, Эти 
значения в сущности представляют собой отклонения от нуля из- 
мерительной шкалы. Общая формула начальных моментов совпа- 
дает по виду с формулой (2.426). 

Придавая показателю степени h различные числовые значения, 
получим начальные моменты нулевого, первого и т.д. порядков. 
Так как эти моменты играют важнейшую роль в определении чи- 
словых характеристик случайной величины, рассмотрим их по- 
дробнее. 

Нулевой начальный момент—это вероятность полной группы 
значений случайной величины: 


k 
m = P= 


Первый начальный момент— это среднее арифметическое зна- 
чение (см. ф-лу (2.86)): 


Е 
m=) ah =М. (2.43a) 
1 


Второй начальный момент— это квадрат среднего квадратиче- 
ского значения (см. ф-лу (2.96)): 


В 
т = 5a 


ist 


=97. (2.436) 
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Третий начальный момент — это куб среднего кубического 3Ha- 
чения (см. ф-лу (2.10)): 


(2.43в) 


Четвертый начальный момент— это четвертая степень сред- 
него четвертой степени (см. ф-лу (2.11)): 


В 
та = Yer = 9*. (2.43г) 


Нулевой начальный момент служит для проверки правильности 
вычисления частостей распределения. Обычно требуется, чтобы 


Е 
0,999 < У\Р; < 1,001 
= 


Первый начальный момент, как неоднократно указывалось, — это 
важнейшая из мер положения распределения на числовой оси 
Остальные начальные моменты служат для вычисления «степен- 
ных» средних и чаще всего для вычисления центральных момен- 
тов. 

Формулы (2.43 а — г) далеко не всегда удобны для практических 
расчетов, так как значения 2; могут иметь большое количество 
значащих цифр, и тогда промежуточные результаты достигают 
астрономических величин. Для практических расчетов по рас- 
пределению используются другие формулы, которые получаются 
из формул (2.43 a—r) с помощью линейного преобразования зна- 
чений: 

2 =А+2, 
где 
zi = Аки, (2.44) 

Здесь 2; — средние значения интервалов группировки; 4—Be- 
личина интервалов, одинаковая для всех них; А— так называе- 
мое условное начало, выбираемое обычно как среднее значение 
модального интервала*; 2; = 2; - А— это, в сущности, тоже на- 
чальное отклонение, только от условного начала отсчета; наконец, 
2! — начальное отклонение от условного начала, нормированное 
интервалом квантования (группировки). 


*Вообще говоря, условное начало А может быть выбрано в пределах 21 + 
2пф1 где угодно, однако для уменьшения расчетов его выбирают там, где 
частость больше. 


Поскольку 2! и =" — тоже отклонения от некоторого начала, то 
по ним можно вычислять начальные моменты, которые соответ- 
ственно будем обозначать т/ и my. Правда, величина этих мо- 
ментов зависит от выбранного начала отсчета. Но легко показать, 


что 
М=т, =А+т|, (2.45) 
где 
(2.46) 
и 
(2.47) 


Поэтому для расчета среднего арифметического значения по рас- 
пределению сначала выбирают условное начало A, затем для всех 
средних значений интервалов zx; осуществляют преобразование 
(2.44), после этого по формуле (2.47) вычисляют my, затем по 
(2.46) — пи и далее по (2.45) окончалельно вычисляют М, 

Начальные моменты, начиная со второго, которые используют- 
ся для вычисления центральных моментов, достаточно определить 
аналогичным путем: 


k 
mi, = Эту, rae my = У (а) Ру (2.48a) 
k 
т} =m}, rae my = (2//)* Ps (2.486) 
+ 
mi, = №ту, rae my = D(z)". (2.488) 
i=l 


Здесь #!' = 4=4 определяется преобразованием (2.44). Такая воз- 
можность обусловлена тем, что величина центральных моментов 
зависит лишь от Л и не зависит от начала отсчета. 

Центральные моменты определяются по так называемым цен- 
тральным отклонениям (20): 


° 

где 2; = 2; — М — центральное отклонение как разность между «те- 
кущими» значениями х; случайной величины Х и ее средним ариф- 
метическим значением М, 


Случайная величина X, заданная центральными отклонениями 
Zj, называется центрированной случайной величиной. Процесс 
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вычисления центральных отклонений, эквивалентный переносу на- 
чала отсчета в точку среднего арифметического значения, назы- 
вают центрированцем случайной величины. 

Нулевой центральный момент, как и все другие нулевые момен- 
ты, равен единице. 

Первый центральный момент теоретически равен нулю: 


Е 
ш= У (и: - MP; 
= 


Но практически это равенство выполняется лишь приближенно, 

из-за неточностей центрирования, в частности из-за округления 

среднего арифметического значения до величины порядка 2:. 
Второй центральный момент есть дисперсия: 


ь 
Sle - м 


Однако чаще, как указывалось, ее вычисляют через начальные 
моменты: 


р. 


D = py = m2 — т? = 52 - М?, 
и наиболее часто — через преобразованные начальные моменты: 
D = из = ть — (ту)? = рой — (т). (2.49) 


Аналогично через преобразованные начальные моменты вычисля- 
ют третий центральный момент: 


из = ms — Зтути + 2(т! 3 = [ту — 3mym/ + 2(т!)3] — (2.50) 
и четвертый центральный момент: 
ba = m4 — 4тут; + вто (т! )? — 3(m})* = 
= [ту — 4тдт! = вт (т//)? — 3(т!)*]. (2.51) 


Здесь значения m и т! определены выше формулами (2.46) и 
(2.47), а значения т) и ту, ту и ту, ту и ту — формулами (2.48 
а— в). Разумеется, третий и четвертый начальные моменты мож- 
но вычислять и через обычные начальные моменты ту, т, тз и 
m4, пользуясь теми же формулами (2.50) и (2.51). 

Основные моменты определяются по основным отклонениям. 
Основными называются центральные отклонения, нормированные 
стандартными отклонениями: 


где о = |УБ|— стандартное отклонение. Очевидно, что основ- 
ные моменты удобнее всего выражать через центральные моменты, 
нормированные h-# степенью стандартного отклонения. 
Наибольший интерес для нас представляют третий основной 
момент 
Beas 
03 
— коэффициент асимметрии и четвертый основной момент 
4 ex +s, 
94 
который используется для определения коэффициента эксцесса: 


Bx = 4-3. 


Учитывая формулы (2.46)—(2.48 а—в), (2.50) и (2.51), a также 
то, что, как следует из (2.49), 


в=УБ=А\/ти — (т’)?, (2.52) 


можно записать расчетные формулы для коэффициентов асимме- 
трии и эксцесса: 


mi — Зтити = 2017) 


As= (2.53) 
чет] 
и 
вх = М Arseny + бт (т)? — Зи), (254) 


[my — (ту)? 
где моменты mi (A = 1,2 и 4) вычисляются по общей формуле 


Е 
ти = eR при =" = А. 
i=) 


BY 


Наконец, абсолютные моменты определяются по абсолютным 
значениям (модулям) любых отклонений, начальных, центральных 
или основных. В частности, для нас представляет некоторый ин- 
терес первый центральный абсолютный момент 


О 
=) + - МАР 


который и называется средним арифметическим отклонением (2.17). 
Наиболее часто вычисляют среднее арифметическое значение, 

дисперсию и стандартное отклонение, реже к ним добавляют ко- 

эффициенты асимметрии и эксцесса. Расчет всех этих параметров 
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по распределению осуществляется в виде последовательной про- 
цедуры, включающей в себя преобразование (2.44) и вычисление 
различных моментов из числа только что рассмотренных. Эта по- 
следовательная процедура в наиболее удобной для вычисления 
форме называется способом произведений". Рассмотрим его на 
примере. 

Пример 2.4. По способу произведений для эмпирического рас- 
пределения значений полупериодов треморовидных колебаний ру- 
ки при слежении за целью вычислить среднее арифметическое зна- 
чение, дисперсию и стандартное отклонение, а также коэффици- 
енты асимметрии и эксцесса. Исходные данные и промежуточные 
величины приведены в табл. 2.10. 


Таблица 2.10 


Исходные данные и промежуточные величины 
к примеру 2.4 (\ = 35,5 ме, А = 71 мс) 


21, Me В aP | рее [Руа [Pay 
35,5 0, 1960 -0, 1960 0, 1960 1960 0, 1960 
71,0 0, 3260 | - - - - - 
106,5 | 0,1720 | 1| 0,1720 | 0,1720 0,1720 0,1720 
142,0 | 0,170 | 2| 0,2340 | 0,4680 0,9360 1,8720 

177,5 | 0,0590 | 3| 0,1770 | 0,5910 1,5930 4,7790 

213,0 0, 0460 4 0,1840. 0,7360 2, 9440 11, 7760. 

248,5 | 0,0280 | 5| 0,1400 | 0,7000 3,5000 | 17,5000 

284,0 | 0,0240 | 6| 0,1440 | 0,8640 5,1840 | 31,1040 

319,5 0,0120 7 0,0840 0, 5880 4, 1160 28, 8120 

355,0 | 0,0090 | 8| 0,0720 | 0,5760 4,6080 | 36,8640 

390,5 0, 0065 9 0, 0585 0,5265 4, 7385 42, 6465 

426,0 | 0,0045 [10| 0,0450 | 0,4500 4,5000 | 45,0000 

Суммы | 1,0000 | - 1,1145 5,8075 32,0955 | 220,7215 
Моменты | то =1| - | mia 1,11] my a 5,81 | ту я 32,1 | mj’ = 220,7 


1. Выберем условное начало по принципу 
Аг, если Р(з:) = тах P;, 
т.е. АЕТ1 мс (табл. 2.10). 
2. Вычислим 2/ = #1-А; очевидно, что при 1; = А x! = 0. 
Чтобы не писаль нули, обычно строку условного начала прочер- 


кивают во всех столбцах, начиная от столбца #!' (см. табл. 2.10). 
Нетрудно убедиться, что при любых 2;, Аи Л значения 2! — это 


*Наряду со способом произведений существует и способ сумм, для ис- 
пользования которого требуются, однако, дополнительные расчетные фор- 
мулы. 


всегда натуральные числа, положительные в сторону возрастания 
значений х; переменной X и отрицательные в сторону убывания 
этих значений. Поэтому после небольшой тренировки значения 2! 
уже не вычисляют, а записывают, согласно мнемоническому пра- 
puny: а) в столбце 2! в строке условного начала А проставить «0» 
или прочерк; 6) если ряд средних значений 2; интервалов возра- 
стает сверху вниз, то выше прочерка проставить соответственно 
xf =-1,-2,-Зит.д., а ниже— 1, 2, Зит.д. (см. табл. 2.10). 

3. Вычислим последовательно по всем столбцам справа от столб- 
ца z! в каждой строке: а) x/P;, 6) (2/Pi)z/, в) [(2/)Р]=! и 
г) (=!) Pile — отсюда и название способа: «способ произведе- 
ний». Разумеется, необходимо учитывать знак отклонения 2/. За- 
метим, что последовательная процедура умножения предыдущего 
результата на zi! выполняется столько раз, сколько параметров 
распределения требуется вычислить: для вычисления М и D— 
два раза; если нужен еще As, то — три; а если нужен и Ех— то, 
как в табл. 2.10, четыре раза. 

4. Суммируем результаты последовательного умножения в че- 
тырех последних столбцах — это и есть начальные моменты ту, 
ту, тд и т{ соответственно. Их значения можно округлить, как 
показано в табл. 2.10. 

5. Вычислим среднее арифметическое значение по формулам 
(2.46) и (2.45) 


т] = Amy = 35,5-1, 11 = 39,4 (mc) , 
М=А+т = 71+39,4 = 110 (мс), 


6. Вычислим дисперсию по формуле (2.49) и стандартное откло- 
нение по формуле (2.52): 


D = 2 - (т/)?] = 35,53(5, 81 — 1,117) = 
= 1260(5, 81 — 1,23) = 1260. 4,58 = 5770,8 (mc)*, 


9=Уб=А\/ти - (mit)? = 35,5 -2,14 = 76 (мс). 


7. Вычислим коэффициент асимметрии по формуле (2.53): 
тё — Зтёти + (т)? 

[тб — (тре Ving = (omy 

_ 32,1-3-5,81- 1,11 + 2(1, 11)? _ 32,1~19,342,7 

ы 4,58. 2,14 = 9,8 


As= 


= 1,58. 
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8. Вычислим коэффициент эксцесса по формуле (2.54): 
nlf = тт + бт (ти? — 3409) _g _ 
[mz — (тр 
_ 220,1-4.32,1-1,11+6-5,81(1, 11)? — 3(1, 11) | 
7. (4,58)? 
_ 220,7 - 142,5+42,9-4,6 
~ 21 
Заметим, что последовательная процедура способа произведе- 
ний допускает использование уже полученных ранее промежуточ- 
ных результатов для дальнейших вычислений. Так, в частности, 


определяя дисперсию и стандартное отклонение, мы вычислили 
промежуточные значения 


[my — (ти) =4,58 и ти - (mi)? = 2,14, 


которые использовали затем при расчете коэффициентов Аз и Ex. 
Итак, искомые значения равны: 


М=0,11с, o%0,08c, Аз 1,58, Ехя2,5. 


Если эмпирическое распределение предполагается в дальней- 
шем нормализовать {см. 2.4), то ограничиваются расчетом стан- 
дартных мер положения и рассеивания — среднего арифметиче- 
ского значения, дисперсии и стандартного отклонения. При этом 
рассчитывать данные, в которых одна-две значащие цифры, удоб- 
нее не с помощью таблицы, а прямо по записанной в виде муль- 
тимножества дифференциальной функции распределения P(X) = 
(Риз, Роха,...,Рьгь). Заметим, что формулу (2.426) в этом случае 
можно записать так: 


Ех = 


oS 


3% 2,5. 


k 
Моменть = > Piz} = > P(X"). (2.55) 
= x 
И тогда среднее арифметическое значение (первый начальный мо- 
мент) определяется суммированием дифференциальной функции 
по аргументу: 


О 
Mx = > P(X) = Ра, (2.56) 
x i=l 


а дисперсия (второй центральный момент) — как разность квадра- 
тов среднего квадратического и среднего арифметического значе- 
ний: 
Рх=3х -мх = )> P(X?) - Mx, (2.57) 
x 


где Mx определено формулой (2.56). Из (2.55) следует и проверка 
условия нормировки (нулевой начальный момент): 


О 
YX") = УР =1. (2.58) 
x i=l 


Пример 2.5. В экспериментах по изучению точности подравни- 
вания человеком яркости объектов под эталонную яркость в одной 
из серий опытов получено распределение модуля ошибки подрав- 
нивания, в %: P(X) = (0,14-0,1; 0,13 -0,2; 0,22 -0,3; 0,20 -0,4; 0,06 -0,5; 
0,05 - 0,6; 0,05 - 0,7; 0,03 - 0,8; 0,03 . 0,9; 0,03 - 1,0; 0,03 - 1,1; 0,02 - 1,2; 
0,01-1,3). Нетрудно убедиться, что условие нормировки (2.58) вы- 
полнено. Вычисляем среднее арифметическое значение по (2.56): 


Mx = 0,014 + 0,026 + 0,066 + 0,080 + 0,030 + 0,030+ 0,035 + 
+0,024+0,027+0,030+ 0,033 + 0,024 + 0,013 = 0, 432 = 0, 4(%). 


По формуле (2.57) вычисляем дисперсию модуля ошибки подрав- 
нивания: 


Dx = (0,14-0,12 +0,13.0,22 +0,22.0,3*+0,20-0,4*+ 
+0,06.0,5° +0,05.0,06? +0,05.0,72 +0,03-0,82 +0,03.0,9+ 


+0,03.1,02+0,03-1,12+0,02-1,22+0,01 -1,3?) - 0,4322 = 
=0,2714- 0,1866 = 0,0848. 


Извлекая из дисперсии корень квадратный, находим стандартное 
отклонение: ох = x = 0,0548 = 0,29 = 0,3(%). Заметим, 
что итоговые результаты округляются до десятых долей соответ- 
ственно измеренным значениям. 


14, ВИДЫ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 
1.4.1, Общие положения 


В природе существует большое разнообразие законов распреде- 
ления, объясняемое свойствами самих случайных величин и усло- 
виями, в которых они подлежат изучению. 

Основные свойства — положение на числовой оси, рассеивание, 
скошенность и выпуклость, рассмотренные выше, —в общем слу- 
чае не определяют полностью аналитическое выражение для за- 
кона распределения некоторой случайной величины. Наоборот, 
аналитическое выражение, сообразующееся как с теоретическими 


знаниями о специфике случайной величины, так и с эксперимен- 
тальными данными о ней, несет всю необходимую информацию о 
случайной величине, в том числе и об основных ее свойствах. 

Говоря о виде закона распределения случайной величины Х, 
будем иметь в виду, во-первых, свойства самой величины Х как 
переменной (дискретность или непрерывность и возможные пре- 
делы области ее существования), во-вторых, свойства реальных 
условий, влияющих так или иначе на случайную величину Х, и, в- 
третьих, определенное аналитическое (геометрическое и таблич- 
ное) представление функций, связывающих значения 1; случайной 
величины Х с соответствующими вероятностями Pj. 

Из большого количества видов известных законов распределе- 
ния мы рассмотрим лишь те, которые в настоящее время могут ис- 
пользоваться в психологических дисциплинах для описания слу- 
чайных переменных. Кроме того, в главе 5 будут рассмотрены 
некоторые из специальных распределений, используемых при ста- 
тистической проверке гипотез. 


14 1, Нормальный закон 
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Нормальный закон* распределения во всех естественных нау- 
ках имеет фундаментальное значение. И в психологических дис- 
циллинах его значение трудно переоценить. Достаточно cka3aTb, 
что все психологические шкалы основываются на этом законе, по- 
скольку ему следуют распределения большинства человеческих 
способностей и свойств. 

Самой общей характеристикой нормального распределения 
является простое наблюдение того закономерного факта, что очень 
большие центральные отклонения (2; — М) встречаются крайне 
редко, а маленькие — часто, при этом одинаковые по модулю от- 
клонения одинаково вероятны. Такая закономерность может иметь 
место в условиях, когда на случайную величину Х действует боль- 
шое число разнообразных факторов и доля воздействия каждого 
из них одинаково мала по сравнению с их числом. 

Вероятность нормально распределенной величине Х принять 
значение 2; на некотором интервале определяется уравнением 


РУС 2 
Plas Х ка) = ane | ‚ 259) 


где М — среднее арифметическое значение; с — стандартное от- 
клонение; 7 = 3,14...; А = 244) — 21, —с0 < Х < 00. Можно видеть, 


"Закон Лаплась — Гаусса (по имени ученых, независимо открывших и ис- 
следовавших его) из-за широкого распространения в природе первоначаль- 
но принимался з® норму распределения любой случайной величины, чем и 
обусловлено название «нормальный закон». 


что, согласно (2.59), значения вероятности определяются не толь- 
ко значениями аргумента х;, но и значениями М, би A, которые, 
естественно, различны у конкретных случайных величин. В этой 
связи целесообразно использовать вместо функции (2.59) функцию 
плотности вероятности, центрированную и нормированную стан- 
дартным отклонением: 


f(z) = = exp(-0, 52%), (2.60) 


vax 
M 


где x = 4M — основные отклонения; f(z) = $P(zi < Х < и!) — 
плотность вероятности. 

Плотность, определяемая уравнением (2.60), называется стан- 
дартной плотностью нормального закона. Ее значения приведены 
в табл. I Приложения 2 

Отметим некоторые свойства нормального распределения на 
примере его стандартной плотности (рис. 2.5, а). 


04 
as 


42 


Puc, 2.5. Плотность (а) и функ 
ция распределения (5) нормаль- 
Moro 3aKOMA в стандартном мас- 
штабе, 

По оси a6cunce — значения слу- 
чайной величины в сдиницах 42 


стандартного отклонения (2), по 
оси ординат — плотности и ве- 0 
роятности соответственно. 


| 
| 
1 
| 
| 
| 
1 


| 
| 


1. При всех значениях 2; переменной X плотность f(z) положи- 
тельна. 

2. Плотность f(z) симметрична относительно математического 
ожидания, которое в этой связи нередко называют центром рассе- 


Se 
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ивания (для симметричных распределений). Коэффициент асим- 
метрии равен нулю. 

3. При увеличении модуля аргумента (|z;| — 00) функция f(z) 
сколь угодно близко (асимптотически) приближается к оси аб- 
сцисс, не достигая ее. 

4. Максимальную плотность нормальное распределение имеет 
при 2; = М: 

А 


ву2т 


f(z = M) = 


— для конкретной случайной величины и 
1 
Vox 


— для стандартного выражения плотности (табл. I Приложения 2). 
Таким образом, в случае нормального распределения численные 
значения среднего арифметического, моды и медианы совпадают. 

5. Из рис. 2.5, а можно видеть, что плотность нормального рас- 
пределения быстро убывает по мере увеличения значений центри- 
рованной случайной величины, выраженных в единицах стандарт- 
ного отклонения; в частности, следует запомнить, что 


f(zi = M) = —= ~ 0,39894 


P(-0 < X <0) = 0,683, (2.61а) 
Р(-20 < X < 20) = 0,954, (2.616) 
P(-30 < Х < 30) = 0,997. (2.61в) 


В этой связи и стандартное (среднее квадратическое) отклонение 
определяют по аналогии с полуинтерквартильным отклонением 
как половину величины интервала, симметричного относительно 
центра рассеивания, для которого вероятность появления на нем 
значения случайной величины Х равна 0,683. 

6. Заметим (рис. 2.5,a), что при значениях —0 и о на кривой 
стандартной плотности имеются точки смены кривизны (переги- 
ба): на участке (—0 < Х < а) функция плотности вогнута вниз, а 
за его пределами, наоборот, вогнута вверх. 

7. Четвертый основной Moment #+ = 3; поэтому в уравнение для 
коэффициента эксцесса и введено слагаемое ( —3), чтобы эксцесс 
нормального распределения численно равнялся нулю и служил 
«началом» отсчета для измерения степени крутости любых функ- 
ций распределения. 

Вероятность случайной величине Х принять значение не боль- 
ше заданного z определяется функцией распределения: 


P(X <=) = F(z), 


где в стандартном масштабе (2 = М) 


F(z) = я [ к exp(—0,52?)dz. (2.62) 


Эта функция изображена на рис. 2.5,6. Так как F(x) симметрична. 
относительно центра рассеивания, то при вычислениях использу- 
ют и разные другие формулы*. 

Несмотря на то, что теоретически нормальный закон распреде- 
ления предполагает существование бесконечно малых и бесконеч- 
но больших значений любой следующей ему случайной величи- 
ны, на практике, тем более в психологии, случайные переменные 
имеют конечные области существования. В этой связи на прак- 
тике используются функции нормального распределения, ограни- 
ченные слева и справа основными отклонениями: —3 < х < 3, как 
в табл. 1 Приложения 2. 

Чтобы установить, является ли эмпирическое распределение 
изучаемой случайной величины нормальным, необходимо сопо- 
ставить сведения о свойствах этой величины и условиях ее изуче- 
ния, известные исследователю, со свойствами функций нормаль- 
ного распределения, рассмотренными выше. Это сопоставление 
вначале является качественным, а затем осуществляется специ- 
альными количественными методами. 

Основой качественного сопоставления служит «физическое» 
Условие появления нормального распределения, а именно дей- 
ствие на изучаемую случайную величину большого числа факто- 
ров, тоже случайных, воздействия которых преимушественно не- 
зависимы и примерно одинаковы. Если такое условие, по мнению 
исследователя, имеет место, то можно ожидать, что изучаемал 
случайная величина распределена нормально. Так, на форми- 
рование способностей человека действует множество различных 
случайных факторов (биологических, физиологических, психиче- 
ских и социальных). В этой связи можно ожидать, что в массе 
людей степень выраженности той или иной способности распре- 
делена нормально. И это во многом подтверждается практикой 
тестирования способностей**. 

Количественное сопоставление включает в себя два последова- 
тельных этапа. Первый — сравнение отдельных свойств эмпири- 
ческого распределения со свойствами нормального закона. Это 
касается прежде всего симметричности (мода, медиана и среднее 


Cm: Абергауз Г.Г. Тронь А.П., Копенкин Ю.Н., Корови- 
ка И.А. Справочник по вероятностным расчетам. M., 1970. 
**См., напр.: Бурлачук Л.Ф., Морозов С.М. Словарь-справочник 
по психологической дизгностике. Киев, 1989. 
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арифметическое примерно или точно одинаковы) и эксцесса (коэф- 
фициент эксцесса близок нулю). Весьма информативным является 
факт наличия точек смены кривизны на сглаженном от руки поли- 
гоне распределения при значениях случайной величины 1; = —в 
и; =o, а также факт приближенного выполнения равенств (2.61 
а—в). Если имеется соответствие между некоторыми из перечи- 
сленных свойств эмпирического и нормального распределения, TO 
можно перейти к следующему этапу. 

Второй этап состоит в вычислении теоретической функции рас- 
пределения по эмпирическому ряду в предположении, что он под- 
чиняется нормальному закону. Именно это предположение и об- 
основывается при качественном и количественном (на первом эта- 
пе) сопоставлении свойств. 

Вычисление теоретических значений вероятностей, соответ- 
ствующих эмпирическим частостям, в общем случае осуществля- 
ется либо по таблицам функций распределения, либо через ло- 
гарифмы, либо с использованием таблиц специальных функций. 
Нередки комбинации двух последних способов. 

В предположении нормального закона обычно пользуются та- 
блицами функций /(2) или F(z). Суть вычисления вероятностей 
здесь такова. Осуществляют преобразование значений х; случай- 
ной величины Х в основные отклонения 

-м 
z . 
o 
для чего, разумеется, предварительно следует по эмпирическо- 
му ряду вычислить оценки М ид. Далее по табл. I Приложения 2 
для всех г эмпирического ряда определяют значения стандартной 
плотности f(z), которые затем умножают на отношение 4, чтобы 
от стандартного перейти к истинному (опытному) масштабу функ- 
ций распределения или значению функции распределения F(z): 


Poles < Х < 2141) = А) 


РЕ(Х < xi) = F(z). 

Сопоставление заканчивается сравнением фактических (получен- 
ных в опыте) частостей и теоретических (вычисленных) вероятно- 
стей. Если различия малы или отсутствуют, то можно считать, 
что изучаемая случайная величина распределена нормально. Ли- 
шенная субъективных предпочтений оценка того, «малы» или «ве- 
лики» получившиеся различия, осуществляется с помощью специ- 
альных критериев согласия, которые будут рассмотрены в главе 5. 

Если согласие теоретического распределения с эмпирическим 
рядом приемлемое, то посредством теоретических функций рас- 


пределения можно решать важные для практических приложений 


задачи: 
— определять вероятности P(x; < Х < 2: + А) при любом по 
величине А; 
— определять вероятности 
P(X <2) и (P(X > zi), (2.63) 
rae 


P(X <2j)+ P(X > zi) = 

— определять квантили (обратная предыдущей задача): по за- 
данной вероятности (2.63) определить значение 2; случайной пе- 
ременной Х; 

— определять среднее арифметическое значение части распре- 
деления, отсекаемой ординатой f(z). 

Пример 2.6. В табл. 2.11 приведен эмпирический ряд распреде- 
‘ления значений амплитуды установившихся колебаний руки чело- 
века. Проверим, является ли данное распределение нормальным, 
и если является, то определим: 

1) 2,5%-е квантили, 75%-й квантиль; 

2) вероятность того, что амплитуда колебаний руки будет боль- 
ше 75 MM; 

3) вероятность того, что амплитуда будет находиться в преде- 
лах 50-70 мм; 

4) среднее арифметическое значение амплитуды при условии, 
что она будет не больше 66 мм. 


Таблаца 8.11 
Расчет теоретических вероятностей к примеру 2.6 


Среднее эначе- | Частость | Основное | Стандартная | Вероятность 


ние интервала wm отклонение | плотность > 
wy =) 
41,5 0,010 -2,9 0, 00595 0,003 
45,5 0,015 -2,3 0, 02833 0,016 
49,5 0,045 -1,7 0, 09405 0,054 
53,5 0,125 —1,15** 0, 20560 0,119 
57,5 0,145 -0,6 0, 33322 0,193 
61,5 0,290 0, 39894 0,231 
65,5 0, 185 0, 33322 0,193 
69,5 0,110 0, 20860 0,119 
73,5 0,065 0,09405 0,054 
77,5 0,000 0,02833 0,016 
81,5 0,010 0,00595 0,003 
Des 1, 73324 1,001 


Примечание. Значения, отмеченные двумя звездочками, 
получены по табл. 1 Приложения 2 путем линейной интерполя- 
ции: f(x + 0,05) = 0, 5[/(=+0,1) - f(z)]- 
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Эмпирическому ряду распределения амплитуды соответствует 
полигон распределения на рис. 2.6. Рассматривая ряд распреде- 
ления и его полигон, можно видеть, что ряд близок симметрич- 
ному. Суммарная частость значений на интервале (53,5 — 69,5), 
несколько большем, чем интервал в два стандартных отклонения 
(20 = 2-6,92 мм), составляет 0,737, т.е. равенство (2.61а) прибли- 
женно выполняется. Среднее арифметическое значение находится 
в том же интервале группировки, что и мода и (из-за симметрич- 
ности) медиана. 


Gs 


a2 


ot 


445 495 575 


Рис. 2.6. Полигон эмпирического ряда расп 
Man ему функция плотности нормального распределения. 

1— полигон; 2— функция плотности; 3— доли распределения вероятно- 
стей, соответствующие 2,5%-M квантилям; 4 — доля, соответствующая 
веролтности Р (50 мм < Х < 70 мм}; 5 — доля, покрывающая часть рас- 
пределения, соответствующую ограниченному 2, = 66 мм (усеченному) 


распределению. 


Конечно, амплитуда движений руки не может быть бесконеч- 
но малой и бесконечно большой, поэтому область существования 
рассматриваемой случайной величины ограничена*. Тем не менее 
уже приведенные черты сходства позволяют предполагать нор- 
мальное распределение и перейти к вычислениям (второй этап со- 
поставления). 

Последовательность вычислений демонстрирует табл.2.11. 
Проверка вычислений x и f(z) осуществляется выполнением pa- 


'Минимальная амплитуда тождественно равна нулю, а максимальная бы- 
ла ограничена в опытах до 400 мм. 


венства 4 >, f(z) = 1. В нашем случае А =4 ив = 6,92; 


Сравнивая пока визуально частости р; и вероятности P?, можно 
видеть, что различия невелики. Следовательно, с определенными 
основаниями можно предполагать, что амплитуда колебаний руки 
распределена нормально. В частности, можно записать функцию, 
связывающую в нашем примере вероятности амплитуде принять 
значения на интервале A = 4 со значениями амплитуды: 


PR(ai <Х < +4) = 0,581), 


где /(г) — стандартная нормальная плотность с параметрами M= 
61,5 uo =6, 92 (см. рис. 2.6). 

Определим теперь интегральную функцию. (Самый простой 
способ — использование табл, | Приложения 2, непосредственно 
дающей теоретические значения вероятностей 


P(X <=) = =(. = 


Эти вероятности приведены в табл. 2.12, а связывающая их функ- 
ция — на рис. 2.7. 


Тоблища 2.12 
Эмпирическая и теоретическая интегральные функции 
'распределения данных к примеру 2.6 


Если под рукой нет таблицы значений F(z), то значения этой 
функции приближенно определяются суммированием вероятно- 
стей P* = P(x; <Х < в +A). Но при этом следует учитывать, 
что для любого интервала Ay, среднему значению Wy, = т которо- 
го сопоставляется вероятность P(X < 2+), искомое значение этой 
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Рис. 2.7. Кумулятивная гистограмма F*(z,) и соответствую- 
man ch функция нормального распределения F(z). 
1 — гистограмма, 2— функция, 9— 75%-Й квантиль. 


вероятности 
kot 
F*(zx) = D0 Pf +0,5PE (2.64) 
1 
включает в себя только половину элемента вероятности Pf, при- 
ходящейся на интервал Ль (рис. 2.7). 

Займемся теперь определением 2,5%-х и 75%-го квантилей рас- 
пределения амплитуд. Как указывалось выше (см. 1.4), квантилем 
называется значение Zo случайной величины X, для которого ве- 
роятность 

P(X <=.) =а. 
Часто вместо вероятности а используют процент, тогда и говорят 
о а-процентном квантиле. 

Квантили непосредственно определяют по таблице значений 

F(z), отыскивая вероятность: 


а= (ть) при a>0,5, 2. >0 


или 
а=1- Р(тк) при а<0,5, % <0, 


после чего, осуществляя обратное преобразование аргумента из 
стандартного в естественный масштаб, определяют 
та = 91, +М. 
1. Итак, 2,5%-x квантилей два — э7о 20,025 И 20,95. Определим 
скачала второй. По табл.1 Приложения 2 находим 
F(2,0) = 0,977 = 0,975. 

Основное отклонение гк = +2, 0 и может служить для приближен- 
ной оценки искомых квантилей (см. рис. 2.6): 

20,025 © 6, 92(—2) + 61,5 == 47,7 (мм), 

20,95 2 6, 92-2 + 61,5 = 75,3 (мм). 
Аналогично вычислим 75%-Й квантиль. Из табл. | Приложения 2 
находим Р(0,7) = 0,75. Следовательно, как показано на рис. 2.7, 

Zo,75 6, 92.0, 7+ 61,5 = 66,3 (мм). 


Заметим теперь, что 75-Й квантиль — это третий квартиль Qs, 
который мы можем вычислить по формулам (1.42) и (1.43), исполь- 
зуя вероятности Р» из табл. 2.11. В частности, по формуле (1.42) 
получим 


Xo,75 = 63,5 + 4(0,750— 0.619) т = 66,3 (мм). 


Таким образом, пользуясь этими формулами, мы можем опреде- 
лять по значениям гистограммы (полигона) любые квантили. 

2. Если нахождение квантиля — это задача нахождения аргу- 
мента по заданному значению функции, то определение искомой 
вероятности — прямая задача, которая решается по той же табли- 
це значений F(z), гдех = тм и г; задан. Так, искомая вероят- 


ность 
75 61,5) _ _ 
(Е) =1- (1,95). 
По табл. I Приложения 2, интерполируя, находим 
F(1, 95) = F(1,9) +0, 5[F(2,0) — F(1,9)] =: 0,974. 
Следовательно, 


P(X > 75 мм =1-РИХ < 15 мм] 


P[X > 75 мы] * 1 — 0,974 = 0,026. 


3. Вероятность того, что случайная величина X, имеющая плот- 
ность f(z), примет значение на конечном замкнутом интервале 
(a— 5), — это определенный интеграл 


b 
Pasx<t)= | Лем, 
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который для нормального закона часто называют функцией Ла- 
пласа, а в общем случае — интегралом вероятности*. Мы будем 
выражать такие вероятности, пользуясь таблицей значений F(z): 


P(a< X <6) = F(b) — F(a) npub>a>Mua<b<M, 
P(a< X <6) =[F(b)+ Е(|а|] -1 при > Миа<М, 
{2.65) 
где М — среднее арифметическое значение. 
Искомая вероятность Р (50 мм < Х < 70 мм) должна быть вы- 
числена по формуле (2.65), так как а < М: 


50 -61,5 70-61,5 ” 
P(50 мм < Х <70 mm) = [r ( oor) +r (Paes) -1= 
= [F(1,65) + F(1,2)] — 1 = 0,950+0,885 — 1 = 0,835; 


эта вероятность показана Ha рис. 2.6. 

4. Задача определения среднего арифметического значения усе- 
ченного распределения может получить большое распростране- 
ние в психологической практике, в частности при оценке средней 
успешности выполнения экспериментальных заданий в подгруппах 
хорошо (плохо) успевающих испытуемых. 

Обозначая среднее арифметическое значение усеченного в «точ- 
ке» 2, распределения случайной величины Х какМ[Х < zy], будем 
использовать для расчетов формулу 


г) 
F@)' 


где f(z) и F(xz)—coorsetcrBeHHo плотность и функция распреде- 
ления нормального закона в стандартном масштабе: z = 2%-М, 
а знак определяется тем, с какой стороны «усекается» распреде- 
ление («плюс», если слева, и «минус», если справа). Так, для 
ть = 66 получаем z = 0,65. По табл. I Приложения 2 находим, 
интерполируя: 


(0,65) = 0,32273 и Е (0,65) = 0, 74189. 


M[X < 24 = М+о (2.66) 


Далее по формуле (2.66) со знаком «минус», так как отсекаются 
большие значения амплитуды, вычисляем: 
0,32273 


MUX < 66 мы] = 61,5 — 6.92 тв 


= 58,5 (мм). 


*В «Справочнике по вероятностным расчетам» [Абергауз Г.Г. 
Тронь А.П., Копенкин Ю.Н., Коровина И.А. 1970] дана сводка 
формул, по-разному выражающих интеграл вероятности. 


1.4.1, Нормализация распределений 
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При измерении психических явлений важное значение имеет 
нормализация распределений, т.е. их отображение в нормальное 
распределение. Помимо обеспечения математической коррект- 
ности обработки результатов посредством нормализации осуще- 
ствляется переход от порядковых шкал к равноинтервальным и 
соизмеряются, превращаются в однокачественные и аддитивные 
(т.е. суммируемые) первично разнокачественные величины. По- 
этому нормализация широко используется в разработке стандарт- 
ных методик, включающих в себя интегральные показатели. Все 
стандартные психологические тесты обязательно нормализованы, 
что обеспечивает наряду с другими причинами высокую точность 
и надежность измерений. 

Известны три метода нормализации — в эксперименте, преобра- 
зованием переменной и по составу. 

Нормализация в эксперименте означает, что, меняя состав те- 
стовых задач (вопросов, стимулов и пр.), подбирают такие, на- 
бор которых приводит к нормальному распределению вероятно- 
стей результатов (затрат времени, баллов, производительности и 
т.д.). Это трудный путь. Обычно его не проходят до конца, огра- 
ничиваясь получением распределения, близкого к симметрично- 
му, которое дальше нормализуют по составу. 

Функционально преобразуя изучаемую переменную У в нор- 
‘мально распределенную переменную X, подбирают вид функции 
Х = $(У), такой, чтобы в результате как-то не по Гауссу распре- 
деленная величина У привела бы к нормально распределенному 
Х. Наиболее распространенный случай — так называемое лога- 
рифмически нормальное распределение, имеющее плотность 


0 приу; <0 
= 1 
Ди) ЕЕ ехр[-0,5и?] при у: >0, 
т: — Мх 
rae u= ae Igy. 


Здесь функция ф, преобразующая у; в 2;, есть десятичный лога- 
рифм. Функциональное преобразование не всегда возможно. В 
частности, необходимо, чтобы преобразуемая переменная Y была. 
‘уже распределена логарифмически нормально, а это встречается 
редко. 

В психологии обычно после приближенной симметризации в 
эксперименте к эмпирическим распределениям применяют норма- 


лизацию по составу*. Суть этого метода заключается в следу- 
ющем. Пользуясь уравнением (2.3), изменяют величину каждого 
интервала ly переменной У так, чтобы при неизменной вероятно- 
сти его плотность стала нормальной: 

Р = Ци)» = Ив) = Ка)№ (2.67) 
При этом необходимому увеличению плотности соответствует 
сжатие исходного интервала, а уменьшению —его расширение 
(рис. 2.8). К сожалению, из четырех переменных в любом из ра- 
венств (2.67) известны только две— исходные плотность и интер- 
вал, а искомые нормальные подбираются приближенно путем ря- 
да итераций. Поэтому нормализация по составу трудоемка и не 
обеспечивает однозначности результатов. 


6 


rly) 


Рис. 2.8. Преобразование плотностей и интервалов переменной У при 
нормализации по составу. 

«— элемент вероятности нормального закона, /(=) — нормальная плот- 
ность; 6— f(z) = 0,5f(y), поетому Ax = 2y; а— /(=) = 2f(y), поэтому 
Az = 0,5AyPy = Pz. 


Таких недостатков лишен метод нормализации функции распре- 
деления**. Суть этого нового метода нормализации заключена. в 
следующем. Поскольку вероятности P; на i-M интервале Ay соот- 
ветствует определенное приращение интегральной функции: 


В = diF(ui) = Ди)№ = Дн) = &Е (=), 


“Cm, напр.: Gutjahr W. Die Messung psychischer Eigenschaften. Berlin, 1971. 

**См.: Суходольский Г. В. Нормализация эмпирических распреде- 
лений // Психологические особенности обучающихся в техническом вузе / 
Под pea. М.Д. Лворяшиной. Ч.1. Новосибирск, 1973. С.77-82; Методы си- 
стемного педагогического исследования/ Под ред. Н.В. Кузьминой. Л., 1980. 
С.141-143. 


то можно определить необходимое значение х; нормально распре- 
деленной случайной переменной Х по конкретному значению yj 
исходной случайной величины, приравнивая значения исходной и 
нормальной интегральных функций и по стандартной таблице на- 
ходя обратную функцию: 


Yi > Ри) = Рад > в = РЦы 


(2.68) 


где Р(=) — стандартная интегральная функция нормального рас- 
пределения, определяемая формулой (2.62). 

Значения 2; выражены в стандартном масштабе (т.е. центриро- 
ваны и нормированы средним квадратическим, или стандартным, 
отклонением) и с вероятностью около 0, 997 занимают интервал от 
—3 до +3, в который благодаря нормализации отображаются лю- 
бые первичные измерения. Применение отрицательных чисел не 
всегда удобно, и обычно в психологических методиках использу- 
ются положительные целочисленные шкальные оценки*. Поэтому 
от стандартных х; следует перейти к новым значениям 


У =oly +My" 


(2.69) 


подходящим образом выбирая стандартное отклонение с [у"] и 
среднее арифметическое значение М [у"] новой шкалы У* 

Процедура нормализации функции распределения сравнитель- 
но проста и сводится к следующим действием. 1. Получить ис- 
ходную функцию F(y). 2. Применяя формулу (2.68), последова- 
тельно для значений Р(у) по табл. I Приложения 2 найти, если 
надо — интерполируя, приближенно равные значениям Р(и) зна- 
чения Р(2;), а для них — обратные им нормально распределен- 
ные значения 2+. 3. По формуле (2.69), предварительно выбрав 
стандартное отклонение и среднее арифметическое значение, рас- 
считаль и округлить до целых чисел значения шкальных оценок, 
4. Сопоставить исходные х; и нормализованные yy B табличной 
номограмме (см., напр., табл. 2.15). 

Пример 2.7. Лля одного из субтестов методики Векслера (оте- 
чественный вариант) получено распределение первичных оценок 
в баллах У (табл. 2.13). Как известно, тест Векслера нормализо- 
ван в целом и по субтестам. Поэтому необходимо нормализовать 
и распределение первичных оценок. Конечно, это следует делать 
на репрезентативной выборке испытуемых. Но принципиальное 
знакомство с нормализацией функции распределения можно осу- 
ществить и на эмпирическом распределении У из табл. 2.13. 


"Гайда В.К., Захаров В.П. Психологическое тестирование. Л., 1982. 
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Таблица ?.13 
Нормализация первичных баллов в шкальные оценки 
к примеру 2.7 


№ | Баллы | Часто- | Часто- | Р(и) = | Стандарт- | Шкальные 
n/n} и | тыл | стир | = F(x) | ные оценки | оценки 
i zi и 
10 | 16 1 0,01 | 0,995 2,60 18 
9 15 4 0,04 0,970 1,90 16 
8 14 3 0,03 0,935 1,50 15 
7{ 13 т 0,07 | 0,885 1,20 14 
6 12 20 0,20 0,750 0, 68 12 
5| п 30 0,30 | 0,500 0,00 10 
«| 10 13 0,13 | 0,285 —0,57 8 
3 9 14 0,14 | 0,150 =1,03 7 
2 8 т 0,07 | 0,045 —ь70 5 
1 h 1 0,01 0,005 —2,60 2 
Суммы | 100 | 1,00 - - | - 


1. По формуле (2.64) рассчитаем значения эмпирической функ- 
ции распределения F(y;): 


F(y1) = 0,00+0,5-0,01 = 0,005; 
Е(уз) = 0,01+0,5.0,07 = 0, 045; 
Р(уз) = 0,01+0,07+0,5.0,14 = 0,150 


итд. (табл. 2.13). 

2. Приравниваем приближенно эти значения стандартным из 
табл. | Приложения 2 и из той же таблицы находим стандартные 
оценки г;: 

Р(у) = 0,005 = 0,00466 = F(z1) + Е-\(21) = 
F(y2) = 0,045 = 0, 04457 = F(z2) + F-"(z2) = -1,7. 


Лля оценки Р(тз) нужно интерполировать по табличным значени- 
ям: 0,13567 < Р(уз) = 0,15000 < 0,15866. Считая от ближайше- 
го — «верхнего» значения, получим поправку (0, 15866 — 0, 15000) = 
(0, 15866 —0, 13567) == 0,3 долей интервала в одну десятую аргумен- 
та. Следовательно, искомое стандартное значение 2; = F—!(z3) = 
—1.0 + (-1)0,3 = -1,03. Аналогично интерполяцией получаем: 
24 = F~'(zq) = —0,5+(—1)-(0, 30854—0, 28500) : (0,30854—0, 27425) = 
—0,57 и другие значения, записанные в табл. 2.13. 

3. В качестве среднего арифметического нормально распреде- 
ленной шкальной оценки, согласно методике Векслера, выберем 
M[y*] = 10, ав качестве стандартного отклонения— с [у*] = 3. 
Тогда шкальные оценки у’ рассчитываются по найденным значе- 
НИЯМ 2; и уравнению "= 32; +10: yf = 3(-2,6) +10 = 2,5 = 


3(-1,7) +10 =5 ит. д. (табл. 2.13). Сравнивал в таблице второй и 
последний столбцы, можно видеть, что в результате нормализации 
произошло растяжение ряда интервалов. 


Пример 2.8. В первых четырех столбцах табл. 2.14 пред- 
ставлено распределение баллов 2, полученное в результате вы- 
полнения той же группой еще одного субтеста Векслера. Ана- 
логично предыдущему нормализуем баллы 2 через Х и отобра- 
зим их в шкальные оценки У”, Для этого снова вычислим эм- 
пирическую функцию распределения F(z;), приравняем ее значе- 
ния — интерполируя, если надо, — стандартным значениям F(z) из 
табл. 1 Приложения 2, определим там же значения 2; и отобразим 
их, округляя до целых, в шкальные оценки у = 32; + 10. Все 
результаты записаны в последних трех столбиах табл. 2.14. Заме- 
тим, что в отличие от предыдущего в данном случае некоторые 
интервалы первичных оценок сжимаются при нормализации. 


Таблица 2.14 
Нормализация первичных баллов в шкальные оценки 


к примеру 2.8 


№ | Баллы | Часто- | Часто- | F(x) = | Стандарт- | Шкальные 
n/a = ты | стир: |= F(zy) | ные оценки | оценки 
tf He. Ed у; 
22 26 1 0, 01 0,995 2,60 18 
a 25 2 0,02 0,980 2,05 16 
20 24 4 0,04 0,950 1,65 15 
19 23 6 0,06 0,900 1,30 14 
18 22 9 0,09 0,825 0,92 13 
17 a 4a 0,04 0, 760 0,70 12 
16 20 8 0,08 0,700 0,53 12 
15 19 5 0,05 0,635 0,35 и 
14 18 6 0,06 0,580 0,20 и 
13 17 5 0,06 0,520 10 
12 16 9 0,09 0,445 10 
и 15 12 0,12 0,340 9 
10 14 7 0,07 0,245 8 
9 13 2 0,02 0,200 8 
8 2 3 0,03 0,175 7 
7) п 5 0,05 | 0,135 7 
6 10 5 0,05 0,085 5 
5 9 3 0,03 | 0,045 5 
4 8 - ~ 0,030 4 
3 7 1 0,01 0,025 4 
2 6 - - 0,020 4 
1 5 2 0,02 0,010 3 
Суммы | 100 | 1,00 = = 
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Как и в стандартном протоколе теста Векслера, для практиче- 
ского использования строится табличная номограмма, в которой 
нормально распределенные первичные («сырые») оценки отобра- 
жены в оценки шкальные. Такая номограмма для примеров 2.7 и 
2.8 приведена в виде табл. 2.15. Из нее нетрудно понять как, благо- 
даря нормализации распределений и отображению в одну и ту же 
шкалу нормально распределенных чисел, происходит соизмерение 
качественно не сравнимых исходных величин. 


Таблица 2.15 


Табличнал номограмма нормально распределенных 
отображений разнокачественных первичных оценок 
в шкальные к примерам 2.7 и 2.8 


Первичные оценки | Шкальные | Первичные оценки | Шкальные 


144, Некоторые другие законы распределения важные для психологии 


Гамма-распределение. Если воздействие одного или нескольких 
факторов из большого их числа, влияющего на случайную вели- 
чину Х, значительно превосходит по силе воздействия все осталь- 
ные факторы, то распределение случайной величины Х приобре- 
тает положительную асимметрию. Плотность вероятности такого 
распределения 

pe а-1„-Р(=-в) 
(2 - e mpuz>yp,a>0, В>0 
Па = теб ия B>0 (то) 
0 в остальных случаях. 
Здесь и — произвольное число, но всегда д > 0; 
(M[X])? M[X] 
So ЗЕЯ» 2.71 
DRY * 9 DR sal 
где М[Х] — математическое ожидание; О[Х] — дисперсия случай- 
ной величины Х; Г(а)— гамма-функция (см. табл. II Приложе- 
ния 2), имя которой гамма-распределение и получило. 


a 


Уравнение (2.70) представляет собой так называемую обобщен- 
ную форму гамма-распределения. При р = 0 либо при подстановке 
y = = — р получается обычное гамма-распределение с плотностью 

BP a1 _-By 
wo te приу> 0, а>0, 8>0 
fe) =| Fey” 


0 в остальных случаях. 


(2.12) 


Здесь обозначения те же, что и в формулах (2.70) и (2.71). 
Интегральная функция гамма-распределения удовлетворяет 
‘уравнению 


у 
PY <y)= ol yr te ау. 


Теоретические значения этой функции непосредственно не табу- 
лированы и определяются обычно косвенным путем”. Лля эмпи- 
рических гистограмм значения кумуляты, характеризующие ве- 
роятность Р*(У < у), вычисляются аналогично тому, как это бы- 
ло показано для нормального распределения, — по формуле (2.64) 
Сходным образом вычисляются для гамма-распределения значе- 
ния интеграла вероятностей: 


Ъ+0,5А 
Pac Y <b)= >) P*(y)—0,5[P*(a) + P*(d))- 


а-0,5^ 


Здесь P*(a <У < 6) — вероятность случайной величине У при- 
нять значения на конечном отрезке < a+b >, где а и 6 — средние 
значения интервалов группировки A; Р*(у) — вероятность появле- 
ния значений у на интервале A; P*(a) и Р*(5) — вероятности по- 
явления значений у на инлервалах со средними значениями а и b 
соответственно. 

При графическом изображении интегральной функции искомая 
вероятность Р*(а < У < b) для гамма-распределения, как и для 
других распределений, непосредственно «снимается» с графика в 
виде 

Р*(а <У<,=Р"(У < 5 -Р"(У <a). (2.73) 

Гамма-распределение находит в психологии все более широкое 
применение благодаря тому, что большинство случайных времен- 
ных интервалов, так или иначе характеризующих психическую 
активность, подчиняется именно этому распределению. В частно- 
сти, время многих реакций человека подчинено гамма-распреде- 
лению. Ему следуют также общие (суммарные) затраты времени 
на последовательность рабочих действий, слабо зависящие (или 


*См., напр. Шори A.B. Кузьмин Ф.И. Таблицы для внализь и 
контроля надежности. M., 1968. 
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не зависящие) друг от друга, причем величина этих затрат для 
разных действий может значительно варьироваться. 

Пример 2.9. Человек-оператор, взаимодействуя с одной из 
подсистем обслуживаемой им системы контроля и управления, 
выполняет разнообразные действия: включение и выключение 
подсистемы, настройку и переключение рабочих режимов и др. 
Путем хронометража в натурных условиях получены оценки об- 
щих затрат времени на действия оператора с указанной подси- 
стемой, которые в зависимости от числа и специфики действий 
варьируются от нескольких секунд до нескольких минут. Эм- 
пирический ряд распределения этих затрат времени приведен в 
первых двух столбцах табл. 2.16. Поскольку длительность неко- 
торых действий человека. с подсистемой значительно превышает 
длительность большинства остальных действий, можно ожидать, 
что случайные затраты рабочего времени подчиняются гамма- 
распределению. Об этом же может свидетельствоваль и скошен- 
ность ряда распределения влево (положительная асимметрия). 


Таблица 2.16 


Расчет вероятностей по гамма-распределению к примеру 2.9: 
P*(t) = 3,16- 10-5. .е-31072 1 


Так как минимальные затраты времени асимптотически стре- 
мятся к нулю*, примем в качестве исходной для расчета двухпа- 
раметрическую форму гамма-распределения (2.72), согласно ко- 
торой вероятность затрат времени 


Ри <T< te +d) (2.74) 


где A = 24 c—muteppan группировки; Т— рабочее время; tj — 
среднее значение затрат времени на {-м интервале A. 


*Например, отдельный взгляд на средства контроля может длиться де- 
сятыс доли секунды, что по сравнению с интервалом группировки Л = 24 с 
является исчезающе малой величиной. 


Вычислив по методу произведений среднее арифметическое 
М[Х] = 76,7 
и дисперсию затрат времени 
D[X] = 1425 е?, 
определим по формуле (2.71) значения параметров a и 8: 
76,72 
1425 


(учитывая, что при целых a Г(а) = (а — 1)!, округлим а до 4, оче- 
видно, без большой потери точности); 


76,7 1 
8 = 15 = 0,053 (9 Е 


Заметим, что параметр В в отличие от а имеет размерность ско- 
рости и характеризует интенсивность (производительность) дей- 
ствий человека-оператора. Подставляя найденные значения пара- 
метров @ и 8, a также Л в формулу (2.74) и обозначая для крат- 
кости искомую вероятность P*(t; < T < tj + A) = Р"(!), получаем 
‘уравнение 


= 4,13 


24(5,3. 10-2)* {8e78.3:10774_ 
co 
Осуществляя преобразование коэффициента при неизвестном: 


24(5,3-10-7)* 
4! 
окончательно получаем расчетное уравнение: 


P(t) =3,16- 10-93275", 


Вычисление вероятностей по этому уравнению проще всего осу- 
шествляется через логарифмы. Логарифмируя функцию вероят- 
ности гамма-распределения, получаем: lg P*(t) = lg(3, 16 - 1075) + 
31-5, 3-10-2 ще = —4, 5003+3 lgt—0, 023. Следовательно, каждое 
значение lg P*(t) получено суммированием значений 3151, 0, 023Ё и 
константы —4,5003. Сопоставляя частости p(t) с вероятностями 
P*(t) из табл. 2.16, можно убедиться в неплохом согласии резуль- 
татов. Гамма-распределение вероятностей общих затрат времени 
показано на рис. 2.9. 

Определим далее, пользуясь формулой (2.64) и данными из 
табл, 2.16, значения кумуляты Р“”(Т < #1), они приведены в 
табл. 2.17. Заметим, что значения кумуляты, соответствующие 
средним значениям интервалов, определяются по формуле (2.64), 
а соответствующие граничным значениям — по формуле (1.40). 


P*(t) = 


= 3,16. 10-3, 
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a Puc. 2.9. Гамма-распределение ве- 
'роятностей общих затрат времени к 
ar примеру 2.9. 
По оси абсцисс — время, с; по оси ор- 
динат — вероятности. Крестиками от- 
0 55 00 150 200 мечены частости. 
Можно, конечно, ограничиться одним из способов, но тогда ока- 
жется затрудненным практическое использование кумуляты для 
определения вероятности P*(T < #) при любом # # ш; или t $ gi. 
Кумулята, представленная удвоенным числом значений P*(T < t), 
как в Табл. 2.17, может быть легко сглажена от руки на графике. 


Табляца 2.17 


Значения кумуляты, вычисленные по значениям вероятностей 
‘из табл. 2.16 


te | Р*(Т <u) | P*(T Sai) | PT $) 
0 0,000 0,000 
12% 0,014 0,014 
24 0,029 0,029 
36* 0,139 0,139 
48 0, 248 0,248 
60* 0,390 0,390 
72 0, 533 0,533 
84* 0,643, 0,643 
96 0,752 0, 752 
108% | 0,818 0,818 
120 0,883 0,883 
132% | 0,917 0,917 
144 0,950 0,950 
156% | 0,966 0,966 
168 0,981 0,981 
180% | 0,987 0, 987 
192 0,993 0,993 
204%) 0,996 0,996 
216 0, 998 0,998 
228% | 0,999 0,999 
240 1,000 1,000 


Примечание. Крестиками отмечены средние значения wy 
интервалов группировки; у; — граничные значения интервалов. 


Сглаженная кумулята (рис. 2.10) является хорошим приближе- 
нием к истинной интегральной функции и позволяет непосред- 
ственно с графика определять интересующие исследователя оцен- 
ки вероятностей. Например, по рис. 2.10 легко определить, что 
вероятность затрат времени на действия с подсистемой не более 
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минуты составляет почти 0,4, а вероятность затрат времени в пре- 
делах одной—двух минут по формуле (2.73) составляет 


P*(60 < T < 120) = P*(T < 120) - P*(T < 60) = 
= 0, 885 — 0,385 = 0,5 


Следовательно, половина всех затрат времени на обслуживание 
лежит в этих пределах. 

Комбинации трех параметров (а, В, и) обеспечивают значитель- 
‘ное разнообразие кривых, в которых реализуется гамма-распреде- 
ление. При больших а гамма-распределение приближается к сим- 
метричному, почти нормальному виду (например, уже при a>10) 
Наоборот, при а<1 гамма-распределение крайне асимметрично 
(модой является у=0). Частным случаем гамма-распределения при 
а=1 является так называемое экспоненциальное распределение. 

Экспоненциальное распределение. Оно имеет плотность 


Пе) = Be-** npuz>0, B>0 
~ ]0 востальных случаях. 


Здесь В = eat и М[Х] — математическое ожидание, а D[X]— 
дисперсия случайной величины Х. 

Интегральная функция экспоненциального распределения опре- 
деляется как 

Е(=) =1-е-#", 
а интеграл вероятности равен 
Ра< Х, <b) =Р®-Р(@)= 7 Ala) _ 010), 
a 


„Для эмпирического ряда показателем того, что ero распределе- 
ние экспоненциальное, служит помимо крайней асимметрии часто- 


стей равенство среднего арифметического значения и стандартно- 
го отклонения: 
м[х] = |. 

Наиболее широко экспоненциальный закон распределения ис- 
пользуется в психологических приложениях теории надежности и 
теории массового обслуживания. В частности, ему следует рас- 
пределение времени между различными ошибочными действиями 
человека, выполняющего некоторую работу. В этой связи пара- 
метр В называют интенсивностью отказов (ошибок) человека. 

Пример 2.10. В экспериментах по изучению надежности эле- 
ментарных вычислительных операций, выполняемых человеком, 
установлено, что при сложении чисел интенсивность ошибок, оста- 
ющихся незамеченными и приводящих к неверному результату, 
составляет 0,42 операции в минуту и является постоянной в тече- 
ние 10 минут вычислений*, Считая, что распределение времени 
между ошибками (t) экспоненциально, можем записать: 


F(t) = 0,420.42 


F(t) =1- 7°47, 
Чтобы воспользоваться этими формулами для вычисления веро- 
ятностей, требуются таблицы функций e~* либо логарифмов. Ло- 
гарифмируя плотность, получаем 
Ig f(t) = lg0, 42 - 0,42 ще! = —0, 3768 — 0,42 .0,43434. 
Например, требуется определить вероятность того, что на интер- 
вале 1 + 0,02 мин появится незамеченная ошибка. Так как А == 1, 
то 
Р(0<Т<1+0,02) = f(t), 
Ig f(t) = -0,3768 — 0, 1824 = —0, 5592. 
Потенцируя, определяем f(1) = 0,276. 

Пусть далее требуется оценить вероятность того, что скрытая 
ошибка появится не позже, чем через 1 мин после начала сложе- 
ния. Преобразуя интегральную функцию, логарифмируем ее: 

Ig(1 — 2(4)] = -ВИве = -0, 43438, 
и подставляем В = 0,42 ut = 1: 
151 — F(t = 1)] = -0,4343-0,42.1 = —0, 1824 = 1,8176, 

*Кандарацкова Н.М., Суходольский Г.В. Об эффективности и 


надежности олементарных вычислительных операций // Эксперименталь- 
ная и прикладная психология / Под ред. Б.Ф. Ломова. Вып. 1. Л., 1968. 
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откуда _ 
antilg(1,8176) =1- F(t = 1) = 0,658. 
Следовательно, искомая вероятность 
P(T <1 мин) = F(t =1 мин) = 1 — 0,658 = 0,342. 

Биномиальное распределение. Пусть выполняется п независи- 
мых испытаний, в каждом из которых может появиться некоторое 
случайное событие А, безусловная вероятность появления которо- 
го постоянна и равна P, а вероятность его непоявления равна |—P. 
Последовательность событий, полученная таким образом, назы- 
вается последовательностью Бернулли (она рассматривалась вы- 
ше). 

Вероятность Р„ш Toro, что в последовательности Бернулли 
длиной в п испытаний некоторое событие А появится ровно т 
раз, равна коэффициенту при неизвестном z™ в разложении би- 
нома [Pz +(1— P)]” по степеням 2: 

Pam = СТР"(1 - Р)"-", 
a 


где Си = aacay YMCA сочетаний из п элементов по т. 
Математическое ожидание числа благоприятных исходов (т) 
определяется величиной 


м 
а дисперсия — произведением 
Би] = nP(1- P) 


Учитывая, что т — натуральное число или нуль, очевидно. сле- 
дует округлять значения обоих параметров до целой части*: 


Mm] = ant{nP} 


D[m] = ant{nP(1 — P)}. 

В психологической практике биномиальное распределение ис- 
пользуется всегда, когда требуется определить априорную веро- 
ятность появления изучаемого события в серии независимых ис- 
пытаний известной длины. В частности, попытки «доказать» су- 
ществование телепатической связи основываются на сравнении 


{Принято считать биномивльный закон распределением существенно дис- 
кретной переменной, что, очевидно, связано с его преимущественным ис- 
пользованием в схеме Бернулли. Но биномиальное распределение можно. 
использовать и для ‘любых неотрицательных: п и т (при т < п), заменяя 
факториалы первого сомножителя на гамма-функции: 


pm Py", 


+1) 


раметры т и п могут иметь смысл времени. 


вероятности ответов перцепиента с априорной вероятностью слу- 
чайного угадывания, вычисляемой по биномиальному распределе- 
нию. Аналогичное сравнение проводится в исследованиях обна- 
ружения пороговых стимулов и вообще там, где требуется уста- 
новить зависимость (или независимость) возможности появления 
какого-либо события от определенных факторов. 

Пусть, например, имеется алфавит (полная группа) из десяти 
событий A; (i = 1,2,...,10), причем вероятность одного из них, 
события Аз, составляет 0,1. Очевидно, вероятность непоявления 
этого события (что эквивалентно появлению любого из осталь- 
ных девяти событий) равна 0,9. Определим, считая появление 
событий в последовательности испытаний независимым, вероят- 
ности Pam событию Аз появиться ровно т раз из п, гле п = 10, а 
m=1,2,..., 10: 


Pro = 0,9° = 10-6, 1-0, 387 0,39, 


Рио 0,98 =245-0,01.0,43 2 0,19, 
Pros = -0,97 = 120-0, 001 - 0,478 = 0.06, 
Poa 0, 9° =210.0,0001 -0,531 ~ 0,01, 
Роз = 0, 9% = 252-0, 00001 - 0,59 = 0,002 


+0, 9% = 210-0, 000001 - 0,656 == 0,0001 


Prog = 


Можно видеть, что вероятность независимого последовательно- 
го появления в серии из 10 испытаний одного из десяти событий, 
имеющего фиксированную вероятность осуществления 0,1, быстро 
уменьшается, так что уже шестикратное появление Аз можно прак- 
тически рассматриваль как событие невозможное. Если бы теперь 
в некоторых условиях, от опыта к опыту, событие Аз появлялось 
бы более чем 6 раз из 10 испытаний, то это свидетельствовало бы 
о том, что появление Аз зависит от условий опыта и схема Бер- 
нулли неадекватна. 

Различные комбинации значений параметров п и т приводят 
к большому разнообразию форм биномиального распределения. 
При п < 20 асимметрия распределения обычно ярко выражена; 
она положительна при Р < 0,5, отрицательна при Р > 0,5; при 
Р = 0,5 распределение симметрично. При п > 20 биномиаль- 
ное распределение для любых, но не очень малых Р симметрично 
и асимптотически приближается к нормальному с параметрами 
M[X] = Рис? [Х] = nP(1- P). 


ГЛАВА ! ‚ КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 
3.1, РАСПРЕДЕЛЕНИЯ В СИСТЕМЕ ИЗ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН 


1/4. Система из двух случайных величин 
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Две случайные величины, рассматриваемые вместе, образуют 
систему. Пусть случайная величина Х задана совокупностью 
своих значений 2; (i = 1 ‚п), а случайная величина У— 
совокупностью значений yj (j = 1,2, _..п). Каждую из случай- 
ных величин можно изобразить совокупностью точек на числовой 
оси, как делали раньше. Ho две случайные величины, расема- 
триваемые вместе, условимся изображать на двух взаимно пер- 
пендикулярных осях — горизонтальной оси Х и вертивальной orn 
У. Тогда событие, состояшее в совместном появлении какой-либо 
пары значений х;у; этих величин, изображается на плоскости в 
системе прямоугольных координат точкой Aj). Так как величины 
Х иуУ случайным образом принимают свои значения, то появле- 
ние любой пары значений 2; — это случайное событие. Поэтому 
точка Ajj случайным образом располагается на плоскости ХОУ 
и называется случайной точкой Следовательно, множеству из п 
пар значений 2;у; случайных величин Х и У’ соответствует п слу- 
чайных точек на плоскости ХОУ (рис.3.1, а). Соединяя точку Ai 


с началом координат, получим вектор OA,;, длина и направление 
которого случайны (рис. 3.1, 6). Поэтому систему из двух слу- 
чайных величин называют случайным вектором на плоскости. А 
так как плоскость имеет два измерения. то говорлт о двумерной 
системе случайных величин. 

Совместное рассмотрение двух случайных величин в психоло- 
гических приложениях может означать, во-первых, их принздлеж- 
ность одному и тому же индивиду, во-вторых, одновременную при- 
надлежность совокупности индивидов и, в-третьих, принадлеж- 
ность этих величин совокупности индивидов, рассматриваемой 
в течение двух различных периодов времени. Так, попарное из- 
учение возрастных особенностей психических качеств личности 


Puc. 3.1. Случайная точка (4) и случайный вектор (6), изо- 
бражающие систему из двух случайных величин X иУ. 


приводит к тому, что на протяжении длительного исследования 
У одного и того же индивида для каждой пары Х и Y опреде- 
ляется совокупность числовых значений 2; (i = 1,2,...,п) и у; 
(j = 1,2,...,n), которые характеризуют возрастные уровни про- 
явления изучаемых качеств личности. Например, раз в полуго- 
дие, на протяжении всего периода дошкольного, школьного и ву- 
зовского обучения (== 20 лет} у индивида измеряются объем непо- 
средственного запоминания (Х) и объем внимания (У). Тогда обе 
случайные величины Х и У оказываются заданными сорока пара- 
ми значений 2;у;. Попарное изучение психических качеств людей 
может осуществляться на протяжении сравнительно небольшого 
периода времени у группы людей числом п. В результате снова, 
для любой пары качеств, измеримой в виде случайных величин Х 
и У, получается совокупность из п пар значений 2;у,. К двумерной 
системе случайных величин приводит также изучение ‘у группы из 
п людей одного и того же психического явления (количественно 
определяемого в виде случайной величины), но измеряемого в те- 
чение двух разных периодов времени или, что то же самое, при 
двух разных комплексах условий. 

Случайные величины в системе характеризуются теми же свой- 
ствами, что и отдельная случайная величина. Это — положение 
И рассеивание значений на числовой оси, а также скошенность и 
крутость. Однако свойства системы не исчерпываются свойства- 
ми образующих ее величин. В системе появляются новые свой- 
ства: ее положение и рассеивание на плоскости (рис. 3.2), ее асим- 


Отредактировал и опубликовал на сайте 


метрия и крутость, а также связь между отдельными случайны- 
ми величинами. Таким образом, количественные характеристики 
двумерной системы должны охватывать как систему в целом, так 
и отдельные составляющие ее случайные величины. 


Рис. 5.2. Положение и рассеивание в системе из двух случай- 
ных величин ХиУ, 
Совокупности случайных точек схематически изображают воз- 


можные различия этих свойств: «— система расположени в 
квадранте ИБ б— система расположена в квадранте |, элесь 
рассеивание больше, чем в случае а, так как точки занимают 
б6льшую площадь. 


Все количественные характеристики двумерной системы, так 
же как и одной случайной величины, принято делить на функции 
распределения и на числовые характеристики, являющиеся пара- 
метрами функций распределения. Двумерная система случайных 
величин характеризуется тремя видами распределений: 

1) совмещенным (совместным) безусловным распределением ве- 
роятностей значений х;у; случайных величин Х и У (двумерное 
распределение, или распределение на плоскости); 

2) двумя безусловными частными распределениями — соответ- 
ственно величины Х и величины У; 

3) совокупностью условных частных распределений вероятно- 


стей значений одной из случайных величин при условии, что дру- 
гая приняла фиксированное (конкретное) значение. 


}.1.1. Совместное распределение двух случайных величин 


Полной количественной характеристикой двумерной системы 
является совместное распределение вероятностей значений 2;у; 
случайных величин X u Y. 

Если X и Y — дискретные переменные, то вероятность совмест- 
ного появления пары значений 2х; — обозначим ее Р(2:у;) — мо- 
жет быть изображена в виде перпендикуляра, восстановленного в 
точке плоскости XOY, имеющей координаты (z;y;). Высота nep- 
пендикуляра равна P(z;y;). Совокупность таких вероятностей, со- 
поставленная совокупности возможных пар значений дискретных 
случайных величин, образует совместное распределение этих ве- 
личин в виде мультимножества, аналогичного дифференциальной 
функции распределения: 


P(XY) = (Ру), (3.1) 


rae вероятности Рузчу; = РИХ = 2:)(¥ = y)] характеризуют 
конъюнкцию событий, состоящих в том, что дискретные случай- 
ные величины Х и У совместно приняли конкретные значения 1: 
изу. 

Другая форма совместного распределения двух дискретных слу- 
чайных величин (аналогичная интегральной функции), задается 
совокупностью вероятностей 


Р(Х < #0 (У <y)], 


сопоставленных всевозможным парам значений этих величин: 
СЖ: : 
PUX < (У < и] =O РИХ = (У =), 
= 


где суммирование выполняется для всех Х < иУ <у.. Счи- 
тая, что совокупность всех возможных пар значений Zjyj образует 
полную группу, очевидно, имеем: 


SY Px = ay =y; 


i=l j=l 


поэтому 
О< РКХ < У <) <1. 


Обе формы совместного распределения вероятностей могут 
быть заданы таблицей (напр., табл. 3.1, где для простоты мы огра- 
ничились тем, что случайные величины X и’У принимают только 
три значения, вероятности которых произвольно заданы) и графи- 
чески (пис. 3.3). а также аналитически в виде формулы. 
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Таблуца 5.1 
Дифференциальная и интегральная функции совместного 
распределенил двух дискретных случайных величин Х и 


РИХ ==) (У =, PX < = (У < у, ] 


Значения т; величины Х | Значения 1; величины Х 


1 j 2 |8 1 | 2 3 
0,10 0,10 | 0,13 | 0,10 0,20 | 0,33 


Значения vy 


1 
величины |2| 0,16 | 0,07 | 0,10 | 0,26 | 043 | 0,66 
3 


0,07 0,16 0,10 0,33 0,66 0,99 


Рис. 3.5. Пространственные столбиковые диаграммы, соот- 
ветствующие вероятностям из табл. 3.1. 

a PUX == (У =). 5—РИХ < = (У <, (вертикальный 
масштаб уменьшен вдвое). 


Для квантованных непрерывных случайных величин X иУ, при- 
нимающих значения на интервалах Ах и Ay соответственно, мо- 
жем рассматривать вероятность Р((х; < Х < =: +Ах)х (у <У< 
у; +A,)] совместного появления пары значений 2; на прямоуголь- 
ном участке площади со сторонами Ах и Ay. Эта вероятность 
геометрически может быть определена объемом прямоугольной 
призмы с высотой f(x;y;) и основанием Ax Лу: 


Pl(zi < Х < и + Ах) SY < yj +Av)) = Р; = Дыши) АхАу. (3.2) 
Совокупность таких вероятностей (Piy), сопоставленная совокуп- 


ности пар интервалов Ax Ay, образует двумерную дифференциаль- 
ную функцию распределения вероятностей значений 2;; кванто- 


ванных непрерывных случайных величин Х и У: 
Р(ХУ) = (Ру), 


где { =1,2,...,k, j = 1,2,...,m, и геометрически изображается в 
виде призмограммы (рис. 3.4, а). 


Puc. 3.4. Призмограмма (а) и кумулятивная призмограмма 
(5, вертикальный масштаб уменьшен вдвое), соответствующие 
вероятностям из табл. 3.2. 


Суммируя вероятности (3.2) по 2; и по у;, определяем вероят- 
ность совместного выполнения неравенств Х <2; HY < yj: 


“% 
РКХ <= )(У < y= OY Ai (3.3) 


isl j=l 


Очевидно, как и для дискретной величины, 


isl j=l 


где п — количество интервалов квантования Ax и Ay. Совокуп- 
ность вероятностей (3.3), сопоставленная совокупности пар интер- 
валов AxAy, образует «интегральную» форму распределения и 
геометрически изображается в виде кумулятивеной призмограммы 
(рис. 3.4, 6). 

Значения вероятностей (3.2) и (3.3), по которым построены приз- 
мограммы на рис. 3.4, приведены в табл. 3.2. 

Величина f(z;y;) в уравнении (3.2) называется двумерной naom- 
ностью вероятности. Она характеризует как бы «массу» веро- 
ATHOCTH, приходящейся на «единичный» прямоугольный элемент 


площади ХОУ, и численно равна высоте элементарной призмы на 
призмограмме (см. рис. 3.4, а). 


Таблица 3.2 
Дифференциальные и интегральные функции распределений 
квантованных случайных величин: 
а) Вероятности Ри; = Р(з, < Х < г, + Ах)(у, ЗУ Cy ty] 
призмограммы (рис. 3.4, 4) 


2 <Х < +» 


5) Вероятности P(X < 
кумулитивной призмограм 


Х 5» 


т [0100.20 
2 [6,26 |043 
3 [6.33 0,66 


Если рассматривать бесконечко малые зиачения интервалов 
квантования dz и dy, то вероятность пепрерывным случайным ве- 
личинам Х иУ принять значения на элементарном прамсутольни- 
ке площадью 4х. dy записывается так: 


Pl(z < Х<=+4=) х (y<¥ <и+ 44] = Кг, уаз ау, 


где /(г,у) — теоретическая функция даумерной плотности. dr > 0 
и 4у> 0. Функция двумерной плотности геометрически предста- 
вляет собой некоторую поверхность, рельеф которой может быть 
любым (так же как и рельеф местности). Наиболее изученными 
являются выпуклые симметричные функции двумерной плотности, 
подчиняющиеся закону Гаусса. 

Интегрируя плотность /(т, у) пох и по у, получаем (инзеграль- 
ную) функцию двумерного распределения: 


Fiew= [ д im Sl2,y)dedy, 
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Рис. 3.5. Геометрическая un. 
терпретация функции двумер- 
ного распределения. 

«— заштрихована площадь фи- 
гуры, удовлетворяющая совме- 
стному решению неравенсть 
Х$ниу<у; 

б— объем пространства, соот- 
ветствующий — вероятности 
РИХ <2)(¥ < у] = Р(гу), где г 
иу— координаты точки А. 


где 


Е(г,у) = Р(Х < 2)(¥ <у]. 


Геометрически F(z, у) — это объем пространства, ограниченного 
сверху поверхностью распределения /(г, у), а снизу — площадью 
фигуры, образованной совместно выполняемыми неравенствами 
Х <гиУ <у (рис. 3.5). 


}.!.}, Частные безусловные и условные эмпирические распределения и взаимосвязь случайных величин в 
двумерной системе 


Как и для случайных событий, совмещенное распределение ве- 
роятностей двух случайных величин количественно полностью ха- 
рактеризует систему из этих величин. Поэтому, суммируя дву- 
мерную дифференциальную функцию распределения по одной из 
случайных переменных, получаем частное (одномерное) безуслов- 
ное распределение оценок вероятностей другой случайной пере- 


менной: 
УСР(ХУ) = Py), УСР(ХУ) = P(x), (3.4) 
x | @ 


где P(XY) определена выше уравнением (3.1), P(Y) = (Py) G = 
1,2,...,m) P(X) = (Вы) (+= 1,2,...,k), причем в скалярном 


выражении безусловные частости составляют 


Е т 
B= Sry я А=У ВЯ 
i= j=l 


rae Ру — совместная частость как элемент совмещенного распре- 
деления. 

Совокупность частостей (вероятностей) P;, сопоставленная со- 
вокупности интервалов A,, на которых случайная величина. X при- 
нимает свои значения 2;, образует эмпирический ряд безусловно- 
го распределения вероятностей случайной величины Х в двумер- 
ной системе. Точно так же совокупность частостей (вероятностей) 
Pj, сопоставленная совокупности интервалов Ay, образует эмпири- 
ческий ряд безусловного распределения вероятностей случайной 
величины Y B той же системе. Оба ряда представлены, например, 
в последней строке и столбце табл. 3.2а. 

Кроме безусловных (совмещенного и частных) распределений в 
двумерной системе существуют и условные распределенил, кото- 
рые образованы условными вероятностями (частостями) появле- 
ния значений одной из величин при условии, что другая величина. 
приняла значение на каком-либо из «своих» интервалов квантова- 
ния. 

Совокупность условных вероятностей (частостей), сопоставлен- 
ная совокупности интервалов квантования одной случайной вели- 
чины, соответствующих как условию некоторому интервалу зна- 
чений другой случайной величины, образует ряд условного рас- 
пределения. Записывая такие ряды в виде мультимножества, по- 
лучаем две группы (дифференциальных функций) условных рас- 
пределений в двумерной системе: 


PUX/ ys) = (Ping н/в), Р(У[ 24) = (Руно [24). 

Каждая из случайных величин имеет столько условных распре- 
делений, на сколько интервалов квантована другая случайная ве- 
личина. Поэтому отдельные условные распределения ассоцииру- 
ются в матрицы условных распределений аналогично тому, как 
это было в системе случайных событий: 

Р(Х/У) = [Р(Х/и); Р(Х/уз); .-.; Р(Х/)], 
Р(У/=1), 


Р(У/Х) = (3.5) 


Заметим, что, транспонируя P(Y/X), можем записать эту матрицу 
как мудьпимножество условных распределений: 


Рт(У/Х) = [Р"(У/=1); P*(Y¥/z2); -..; Р"(У/=ь]]. 
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Как и для случайных событий, вероятность (частость) совмест- 
ного появления пары значений 2;у; определяется произведением 
безусловной вероятности появления одного из значений на услов- 
ную вероятность значения другой величины при условии, что пер- 
вое произошло: 


Рау; = Риз Руни [ая = Ряд ^ Рут, 


или короче: 

Pay = Pi Pip = Р-Р» (3.6) 
где Р; вероятность совмещения любой пары значений Ha эле- 
менте плоскосзи со сторонами Л, и Ay; Ри Р; — безусловные ве- 
роятности появления значений х; и у; на «своих» интервалах; Р;/; 
или P, условные вероятности (условных) событий 2:/у; или 
у;/2ё, которые состоят в том, что 2; появилось при условии по- 
явления у; или чте у; полвилось при условии появления 2;. 

Из (3.6) следует, что условные вероятности определяются де- 
лением совместных веролтностей на веролтности условий: 


Ры=Р;:Р Pye = Pig Pie (3.7) 


Обобщая скалярные уравнения (3.6) и (3.7), можем, как и для си- 
стем событий, записать матричные уравнения распределений ве- 
роятностей (частостей) в двумерной системе случайных величин: 


Р(ХУ) = P(X) о Р(У/Х) = Р(У} < Р(Х/У), (3.8) 

Р(У/Х) = PIAY P(X), P(X/Y) = Р(ХУ)8Р(У), (3.9) 
которыми удобно пользоваться лля практических расчетов. 

Осковываясь на услолиях независимости случайных событий 


{1.26), можио сформулиронать условия стохастической независи- 
мости дьух случайных величин: 


P(X/yj) = P(X) и Т(У/з:) = Р(У) (3.10) 


для всех j = 1,2,....m ui = 1,2,...,k. При нарушении этих 
равенств имеет место стогастическая связь — зависимость между 
случайными величинами X иУ. 

`Лля иллюстрации уравнений (3.4), (3.9) и (3.10) рассмотрим не- 
сложный пример. Пусть случайная величина Х квантована на 
два интервала, причем 2}, 22 — средние значения этих интервал 
лов; аналогично для У у, yo, Уз — средние значения трех ин- 
тервалов квантования. (Совыешенное распределение частостей 
декартова произведения указанных интервалов такое: Р(ХУ) = 
(0,062,491, 0,1029, O.04zyy5, 0,2422м, 0,4022у», 01622уз). Сум 
мируя «по У», находим частное распределение для Х: P(X) = 
[(0,0621y1 + 0,102:y2 + 0,042; ys), (0,242 + 0.402242 + 0,1622уз)] = 


(0,22, 0,822). Точно так же, суммируя «по Х», находим част- 
ное распределение для У: Р(У) = [(0,06z1y: +0,2422y1), (0,1021уз + 
0,4022у2), (0,042 1уз +0,1622з)] = (0,391, 0,5y2, 0,2уз). Дальше, поль- 
зуясь уравнениями (3.9), вычисляем матрицы условных распреде- 
лений, которые записываем на мультимножествах: 
Р(Х/У) = (0,062, 0,24z2y1) : 0,391; (0,1021y2, 0.402242) : 0,5y25 
(0,04=2луз, 0,1622ys) : 0,23] = 


= (0,221, 0,822/зл; 0,2r1y2, 0,82оую; 0,2r1ys, 0,822/ys); 


Р(У/Х) = [(0,0621y1, 0,102, y2,0,042 143) : 0,221; 
(0,242241 0402242, 0162245) : 0.822] = 
= (0,39 (21, 0,5y2/21. 0.2u3/21; 0.3% / хо. Оу / та, 0,2уз/ 2). 


Можно видеть, что все условные распределения равны «своим» 
безусловным, и, следовательно, по {3.10) Х и У -- независимые 
случайные переменные. 


}.1. ХАРАКТЕРИСТИКИ ПОЛОЖЕНИЯ, РАССЕИВАНИЯ И СВЯЗИ 


1.1.1, Числовые характеристики положения и рассеивания 


Каждое из распределений имеклпих место в лнумерной систе- 
ме, характеризуется теми же общими свойствами, что и pacnpeac- 
ление одной случайной величины. Олнако чаше всего используют 
симметричные двумерные распределения, нормальные либо близ- 
кие кнормальному. И по этой причине рассматривают преимуще- 
ственно характеристики положения, рассеивания и связи между 
величинами. Характеристики положения и рассеивания делятся 
на числовые и функциональные. 

В качестве числовых характеристик (мер) положения использу- 
ются главным образом средние арифметические значения. 

Положение совместного распределения на илоскосли ХОУ xa- 
рактеризуется точкой с координатами (M[X], M[Y’]), где М[Х] — 
безусловное среднее арифметическое значение, характеризующее 
положение безусловного распределения случайной величины Х на 
числовой оси 2; М[ У] — безусловное среднее арифметическое зна- 
чение, характеризующее положение безусловного распределения 
случайной величины У на числовой оси у. В дальнейшем для крат- 
кости будем называть М[Х] безусловным средним от X, а М У] — 
безусловным средним от У. 
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Положение условного распределения 2/у; на плоскости XOY 
характеризуется точкой с координатами (М[=/у;], yj), где у— 
фиксированное значение случайной величины У, относительно 
которого рассматривается условное распределение величины Х; 
M[z/y;] — условное среднее арифметическое значение величины Х 
при фиксированном значении у; (сокращенно: условное среднее 
«X по yj»). Положение условного распределения у/2; на плоско- 
сти ХОУ также определяется точкой с координатами (z;, M[y/z;)), 
где 2; — фиксированное значение случайной величины X, относи- 
тельно которого рассматривается условное распределение вели- 
чины У; M[y/zi] — условное среднее арифметическое значение слу- 
чайной величины У при фиксированном значении 2;. Это условное 
среднее «У по z;> и определяет положение условного распределе- 
ния относительно оси у. Условных средних M[z/y;] и M[y/zi] в 
двумерной системе столько же, сколько условных распределений 
рассматривается. 

Безусловные и условные средние арифметические значения ана- 
литически определяются по тем же «понятийным» формулам, ко- 
торые были рассмотрены для отдельной случайной величины. 
Расчетные формулы будут даны ниже. 

В качестве числовых характеристик (мер) рассеивания для ка- 
ждого из рассмотренных распределений преимущественно исполь- 
зуются дисперсии и стандартные отклонения. 

Рассеивание двумерного распределения характеризуется двумя 
дисперсиями и соответственно двумя стандартными отклонения- 


ми: 
D[X] и o[X] = VDIX], 
БУ] и с« У] = МО 
где D[X] — безусловная (общая) дисперсия случайной величины X 
(при всех значениях величины У); о[Х] — безусловное стандартное 
отклонение случайной величины Х; ГУ] — безусловная (общая) 
дисперсия случайной величины У (при всех значениях величины 
Х); o[Y] — безусловное стандартное отклонение У. 

Рассеивание любого условного распределения характеризуется 
‘условной дисперсией и условным стандартным отклонением. Бу- 
дем обозначать: О[2/у;| — (условную) дисперсию условного рас- 
пределения z/y;; o[z/y;] = /D[z/y;] — соответствующее стандарт- 
ное отклонение; О[у/з;] — (условную) дисперсию условного рас- 
пределения y/z;; o[y/xi] = \/D[y/zi] — соответствующее стандарт" 
ное отклонение. 

Безусловные и условные дисперсии аналитически определяют" 
ся теми же «понятийными» формулами, что и дисперсия отдель- 
ной случайной величины. Расчетные формулы рассмотрим ниже. 


1.11. Простые регрессии 


Функцию, связывающую какой-либо параметр условных рас- 
пределений одной случайной величины со значениями другой слу- 
чайной величины, будем называть (простой) регрессией. В двумер- 
ной системе различают регрессии «У на Х» и регрессии «Х на 
у». 

Обычно рассматривают только параметр положения — услов- 
ные средние арифметические одной величины в функции от зна- 
чений другой. Тогда регрессия «У на X» (или у/2;) — это геоме- 
трическое место условных средних M[y/z;], соответствующих зна- 
чениям х;, которые принимает случайная величина Х на интерва- 
лах квантования Ах (рис. 3.6, а). Будем обозначать эту регрессию 
ух = 4(1:). Другая регрессия — zy = $(у;) — это геометрическое 
место условных средних M[z/y;], соответствующих значениям уу, 
которые случайная величина У’принимает на «своих» интервалах 
квантования Ay (рис. 3.6, 6). 

В психологических исследованиях наряду с регрессиями услов- 
ных средних существенное значение могут иметь регрессии дру- 
тих параметров условных распределений: дисперсий, стандарт- 
ных отклонений, размахов, коэффициентов асимметрии и т. д. На- 
пример, для условных стандартных отклонений это будут регрес- 
сии 


oly/zi] = Че) и ofz/y;) = $.) 

Здесь в общем виде рассмотрим простую регрессию u = &(2), 
в которой и— некоторый параметр одной из случайных величин 
(условное среднее, условная дисперсия, условное стандартное от- 
клонение ил. д.), г — значения другой случайной величины в рас- 
сматриваемой системе, а & — функция, устанавливающая соответ- 
ствие между : как независимой и и как зависимой переменными, 
По виду функции & все регрессии подразделяются на два класса: 
линейных и нелинейных регрессий. 

Линейная регрессия в системе прямоугольных координат имеет 
вид прямой линии (рис. 3.6, 6). Она описывается уравнением 


u=az+b, 


где $ — свободный член, характеризующий значение и при усло- 
вии z = 0; а— (угловой) коэффициент регрессии, характеризующий 
скорость изменения переменной и в зависимости от изменения ар- 
тумента =. Коэффициент регрессии численно равен тангенсу угла 
наклона а линии регрессии относительно оси аргумента: 
a=tga=—~ (3.11) 


rot) 
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Рис. 3.6. Простые регрессии. 

инейная регрессия, 6 — линейная регрессия. Заштри- 
хованы условные плотности вероятностей {(v/z1)(a) и /(=/у,)(6). 
Крестиками обозначены условные средние M(y/2)(a) и М(2/у,}(6). 
Остальные обозначения в тексте. 


где Ди = щу1 - и; — изменение зависимой переменной и, соот- 
ветствующее Az = 2;4; — 2; — изменению аргумента 2; а > 0 при 
0<а< 90° иа< 0 приа > 90°, как показано на рис. 3.7. 

Нелинейные регрессии (рис. 3.6, а) могут быть любой криво- 
линейной формы: монотонные — возрастающие или убывающие, 
периодические — простые и сложные. 

Монотонные нелинейные регрессии во многих случаях могут 
быть аналитически выражены некоторой комбинацией членов по- 


Puc. 3.7. Геометрическая интерире- 
тация линии регрессии u = а: +b. 
1—а>0, b<0; 2—а<0, b>0. 


линома (параболы) А-Й степени: 
и = ао +412 +а2:? +---+а,-12^7' + аь2^, (3.12) 


где A принимает целочисленные значения от 0 до любого заланно- 
го п; а^ — коэффициенты полинома — любые действительные чи- 
сла. Нетрудно видеть, что при h = 0; 1 и всех ал>1 = 0 полином 1-й 
степени — это прямая линия (и = ао-+а\ 2), которая, таким образом, 
является частным случаем нелинейной регрессии. При А = 0;1;2 
и всех ал>2 = 0 имеем обычную параболу (и = ао + а: + a22*), 

Расширяя область значений показателя степени h до всех дей- 
ствительных, отличных от нуля, чисел и используя замену пере- 
менных, можем из полинома (3.12) получить ряд других, важных 
для психологических приложений функций: степенную— и = ал2^ 
при h > 0; гиперболу— и = ал=^^ = Sp или и = во + а,=^^; по- 
казательную—-и = алй*, где А — константа; и, в частности, axcno- 
ненциальную — м = ane, где h = е— основание натуральных лога- 
рифмов, константа $ — действительное число; логарифмическую — 
и = a, 105 + ao, где = = 108 — логарифм (по любому основанию) 
нового аргумента @ (в частном случае ay = 0), 

Простые периодические функции — это обычно sinz, cosz, a 
также tgz и ctgz. Они находят свое применение при анализе 
амплитудно-частотных характеристик и при изучении моторной 
активности человека в разных отраслях психологии и физиологии 
труда и спорта. ‚, м 

Чаще, однако, встречаются сложные периодические функции, 
которые представляют собой комбинации (суммы и/или произве- 
дения) периодических и монотонных функций. В качестве приме- 
ров можно привести следующие функции. 
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1. «Затухающий синус» (по Ф. Кликсу)*: 
Dz = Ke~* sin(wt + фо), 


где О; — зависящее от времени (t) положение феноменального про- 
странственного направления; К и а— константы, зависящие от 
условий опыта; «— круговая частота колебаний; фо — фазовый 
сдвиг, обусловленный запаздыванием реакции анализаторных си- 
стем человеческого организма. 

2. «Затухающий косинус», широко используемый при корреля- 
ционном анализе случайных психических и физиологических про- 
цессов**, а также процессов поведения человека-оператора при 
слежении***: 

R(r) = Ae~*!"! cos Br, 


где К(т) — корреляционная функция, зависящая от т — интервала 
времени, в течение которого существует связь между значениями 
исследуемого процесса; В — круговая частота; А и а — масштаб- 
ные параметры. 

3. Комбинация косинуса и параболы, характеризующая диспе- 
рсию (и) эффективности восприятия некоторых заглавных букв 
человеком в зависимости от средней эффективности (z), т.е. ре- 
грессия дисперсии на среднее арифметическое****: 

u=a(z—1,5)(26— 2) 
при 
а=0,07 + 0,038 соз(13,852), 15<2<24. 


3.2.3. Корреляция и ее свойства 


Согласно условиям (3.10) случайные величины Х и У незави- 
симы в стохастическом (вероятностном) смысле лишь тогда, ко- 
гда все условные распределения тождественно равны безуслов- 
ным. В противном случае величины Х и У считаются стохастиче- 
ски связанными. Таким образом, в общем случае стохастическая 
связь имеется тогда, когда каждому из значений одной случайной 


Кликс ©. Проблемы психофизики восприятия пространства. М., 1965. 
С.136. 

="Сергесь Г.А., Павлова Л.П., Романенко А.Ф. Статистические 
методы исследования электроенцефалограммы человека. М., 1968. 
“Сергеев Г.А. Суходольский Г.В., Водлозеров В.М. Ис- 
следование статистических хьрактеристик человека-оператора при нестьци- 
онарных входных воздействиях// Система «человек и автомат» / Под ред. 
Д.А. Ошанина. M., 1965. 

****Суходольский Г.В. К проблеме надежности человека // Вопросы 
инженерной психологии в автоматизированных системах управления / Под 
ред. С.Н. Сафаряна. Л., 1972. 


величины соответствует специфическое (условное) распределение 
вероятностей значений другой величины и, наоборот, когда ка- 
ждому из значений этой другой величины соответствует специфи- 
ческое (условное) распределение вероятностей значений первой 
случайной величины. 

Специфичность условных распределений по сравнению с «од- 
ноименными» безусловными распределениями может состоять: 

— в отличии условных средних от безусловных, 

— в отличии условных дисперсий от безусловных, 

— в отличии коэффициентов асимметрии (или эксцесса) услов- 
ных распределений от этих коэффициентов безусловного распре- 
деления, 

— в сочетании перечисленных отличий. 

Частным случаем стохастической связи является корреляция. 
Корреляция состоит в том, что условные средние каждой случай- 
ной величины отличаются от «своих» безусловных средних, а по 
этой причине, как будет показано, и условные дисперсии отлича- 
ются от безусловных дисперсий. Из такого определения корреля- 
ции следует, что наличие корреляции не исчерпывает возможных 
видов стохастической связи (зависимости) между двумя случай- 
ными величинами, а отсутствие корреляции не означает еще от- 
сутствия других проявлений зависимости. Лишь для двумерного 
нормального распределения стохастическая связь исчерпывается 
корреляцией. 

Можно выделить четыре основных свойства корреляции: на- 
правленность, тесноту, форму и направление, 

Направленность, как и в случае сопряженности, характеризу- 
ет одностороннюю обусловленность изменения значений одной из 
случайных величин изменениями значений другой случайной ве- 
личины. В общем случае возможна как односторонняя направлен- 
ность: Х обусловлено Y, но не наоборот, или У обусловлено X, 
но не наоборот, так и двусторонняя (взаимная) направленность: 
Х обусловливает Y, a У обусловливает Х. В частном случае дву- 
мерного нормального распределения корреляция всегда взаимна. 
Но при этом могут оказаться различными степени корреляции. В 
этой связи будем различать корреляцию z по у (z/y) и корреля- 
цию у по z (y/z). 

Теснота (сила, высота и т.п.) корреляции— это степень об- 
‘условленности изменений X значениями Y или, наоборот, У’ зна- 
чениями Х. Поскольку эта обусловленность проявляется в отли- 
чии условных средних от «своих» безусловных средних, то тесно- 
та корреляции (z/y) характеризуется степенью отличия условных 
средних M(z/y] от М[Х], а теснота корреляции (y/z) характеризу- 
ется степенью отличия условных средних М[у/2;] от M[Y]. 


Форма корреляции определяется линейностью или нелинейно- 
стью регрессий M[y/z] = ¥(z) и M[z/y] = $(у). Соответствен- 
но принято различать линейную и нелинейную корреляции. Ли- 
нейной корреляция является тогда, когда обе регрессии линейны. 
Если хотя бы одна из регрессий нелинейна, то и корреляция явля- 
ется нелинейной. Иногда нелинейностями регрессий можно пре- 
небречь. Тогда их приближенно заменяют прямыми линиями и 
корреляцию считают квазилинейной. Следует подчеркнуть, что в 
психологической практике чаще встречаются нелинейная и квази- 
линейная корреляции. 

Направление корреляции выражается направлением регрессии. 
Если регрессия есть возрастающая функция своего аргумента 
(а > 0), то направление считают положительным (см. рис. 3.8, 6,2, е). 
Если регрессия есть убывающая функция своего аргумента (а < 
0), то направление считают отрицательным (см. рис. 3.8, в,д, ж). 


114. Меры корреляции 
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Универсальной мерой тесноты связи является коэффициент де- 
терминации, который представляет собой отношение дисперсии 
условных средних к безусловной дисперсии. 

На рис. 3.6 можно видеть, что общий размах безусловного рас- 
пределения каждой случайной величины есть сумма. 


ЧУ] = d [М(у/з:)] + do [у/ =] 


и 
4х] = d[M(x/yj)] + do [=/у;, 

rae d[M(y/2;)] — размах, характеризующий рассеивание условных 
средних M(y/z;); d{M(z/y;)]— размах, характеризующий рассеи- 
вание условных средних M(z/y;); 4 [у/=;] — часть общего разма- 
ха случайной величины У, определяемая рассеиванием условных 
распределений y/zx;; do[z/yj;]— часть общего размаха случайной 
величины Х, определяемая рассеиванием условных распределе- 
ний 2/y;. 

Всли вместо размаха воспользоваться более точной мерой рас- 
сеивания— дисперсией, то можно записать аналогичные равен- 
ства и для дисперсий: 


БУ] = D[M(y/z:)] + Do [/=] 
и 0х] = D[M(z/y;)) + Do [z/y], 
rae ОУ] и D[X] — безусловные дисперсии; D[M(y/zi)] и 


D[M(z/y;)] — дисперсии условных средних относительно «своих» 
безусловных средних; Do[y/zi] и О.[т/у;] — средние из условных 


(3.13) 
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дисперсий*, Все эти дисперсии вычисляются различными спосо- 
бами, которые рассматриваются ниже. Здесь ограничимся «поня- 
тийными» формулами для дисперсий условных средних: 


D[M(w/zi)] = >> {М (v/a) — МУ], 
1 


орел = SoM (2/5) — MEX? В, 


j=l 


и для средних из условных дисперсий: 


Do w/z) = ОБР 


Deolz/u] = СВ), 
j=l 
где i = 1,2,....п- номера условных распределений y/zi; j = 
1,2,....п— номера условных распределений 2/4; Ри Р;^_ без- 
‘условные вероятности для X иУ. 
Из уравнений (3.13) после простых преобразований следуют 
формулы, определяющие в общем виде коэффициент детермина- 
ции величины У величиной X 


2 = 2М(/4] _ ) _ Doly/xi) 


Ny je = DY) ~~! py (3.14а) 
и коэффициент детерминации величины Х величиной Y: 
D[M р i 
Ry = DIM (2/y) _ ia = НР (3.146) 


Таким образом, коэффициенты детерминации показывают относи- 

тельную долю отличия условных средних от безусловных, причем 

мерой отличия являются дисперсии условных средних. 
Анализируя уравнения (3.14), можно видеть, что 


тек, 05, <1 


Следовательно, максимально тесная корреляция имеет место то- 
гда, когда вся безусловная дисперсия исчерпывается дисперсией 
условных средних. Например, 


Р[М(у/ 24] = D[Y], 


*При етом предполагается, что условные дисперсии D{y/z\] не зависят от 
Х, ь условные дисперсии D[z/y,] не зависит от У. 


как показано для линейного случая на рис. 3.8,е и ж. Здесь мы 
имеем дело с частным случаем стохастической связи — с функци- 
ональной зависимостью. Заметим, что при функциональной за- 
висимости обе регрессии сливаются в одну и оба коэффициента 
детерминации оказываются равными единице. 

Наоборот, корреляция отсутствует, если вся безусловная дис- 
персия исчерпывается средним из условных дисперсий. Напри- 


мер, 
Do [v/zi] = БУ}, 


как показано на рис. 3.8, а. Поскольку по смыслу отношения 


D{Y) ОХ] 


противоположны коэффициентам детерминации, их иногда исполь- 
зуют как меры необусловленности изменений средних одной слу- 
чайной величины изменениями другой и называют хоэффициента- 
‚ми акорреляции (индетерминации). Коэффициент акорреляции, та- 
ким образом, показывает долю изменчивости, обусловленную по- 
сторонними факторами, которые находятся за пределами рассма- 
триваемой двумерной системы Х иУ. 

Наряду с коэффициентами детерминации для измерения тесно- 
ты однонаправленной связи применяются корреляционные отно- 


шения: 
Пре = Myer пы = ТЕ (3.15) 


Распространенными мерами тесноты и направления линейной 
взаимной связи являются ковариация и коэффициент корреляции. 

'Ковариация (COV) — это среднее произведение центральных от- 
клонений: 


COV = S70 (ei - М] (и - MIY]) Bi, (3.16) 


ЗЕ 


где Pj; — вероятности (частости) совместного появления пар зна- 
чений х;у;. 

Важно понять и запомнить основные свойства ковариации как 
меры тесноты и направления корреляции. 

1. Ковариация случайной величины с самой собой есть диспе- 
рсия: 

COV[XX] = D[X], СОУ[УУ] = DIY). 

2. Ковариация максимальна по абсолютной величине и равна 
дисперсии D[X] = D[Y] при функциональной зависимости, когда 
прямая у = az + 6 располагается к оси абсцисс под углом 45° или 
135° (рис. 3.8, еи a). 


Wy) 


Puc, 3.8. Свойства линейной корреляции. 
«— корреляция отсутствует. Слабая корреляция: 6— положи- 
тельная, «— отрицьтельная. Сильная корреляция: #— поло- 
жительная, д— отрицательная. Полная корреляция (функци- 
овальнья зависимость): «— положительная, ж— отрицатель- 
ная, МУ] и МХ] — безусловные средние; M[y/2] м M[z/v]— 
регрессии условных средних. 
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3. Ковариация по абсолютной величине равна нулю при гори- 
зонтальном расположении линии регрессии y/z; и вертикальном 
расположении линии регрессии г/у; (рис 3.8, а), а также стремит- 
ся к нулю при нелинейной регрессии параболического вида (как 
на рис. 3.6, а). Таким образом, модуль ковариации заключен в пре- 
делах 

0 < 60| < РО] = DIY]. 

4. Ковариация положительна при положительной и отрицатель- 
на при отрицательной корреляции. Знак ковариации определяется 
тем, что при положительной связи все центральные отклонения в 
формуле (3.16) положительны (рис. 3.8, 6,2, e), а при отрицатель- 
ной связи положительное центральное отклонение одной величи- 
ны всегда умножается на отрицательное центральное отклонение 
другой величины (рис. 3.8, в, д, ж). 

Коэффициент (линейной) корреляции (г) можно определить не- 
сколькими способами. 

Во-первых, при строго линейной корреляции теоретически связь 
полностью взаимна, в результате 


Tyla = yy = (3.17) 


откуда получается, что 
ТЕ Ny/z = Nely (3.18) 


Практически, однако, всегда имеются отличия эмпирических ре- 
грессий от линейных и равенства (3.17) и (3.18) не выполняются. 
Но коэффициент корреляции всегда меньше хотя бы одного из кор- 
реляционных отношений. 


Во-вторых, можно определить коэффициент корреляции как ко- 
вариацию, нормированную произведением стандартных отклоне- 


ний: 
_ _COV 
© ое! 
При этом, учитывая свойства ковариации, запомним: 


157 <1и0< < 


(3.19) 


т.е. знак коэффициента корреляции характеризует направление 
связи, а модуль |"| — ее тесноту. 

В-третьих, можно определить коэффициент корреляции как 
среднее геометрическое из коэффициентов регрессии: 


r= Уват, (3.20) 


где ау), — угловой коэффициент прямой регрессии y/z и ae/y— 
угловой коэффициент прямой регрессии 2/у. 
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Из уравнений (3.19) и (3.20) нетрудно определить 


и = it = и (3.21a) 
ix 
iS я = OT (3.216) 


В-четвертых, из равенств (3.19)-(3.21) следует, что коэффициент 
корреляции— это стандартизованный коэффициент регрессии: 


eX] a, of] (3.22) 
w= iy] = “FY fx] i 

Ha практике для вычисления г используются преимущественно 
последние три способа, а первый служит для проверки степени 
отличия регрессий от линейных, а также для оценки доли взаи- 
мовлияния переменных по сравнению с долями их одностороннего 
влияния. В этой связи заметим, что взаимная линейная корреля- 
ция двух случайных величин может быть на самом деле обусло- 
влена влиянием на эти величины некоторой другой неизвестной 
величины (или нескольких величин, см. главу 7) 


r= 


1.1.4, Совокупные характеристики положения рассеивания и связи 


Отдельные меры положения, рассеивания и связи для двумер- 
ной случайной величины ХУ можно представить в матричном ви- 
де. При этом в целом положение системы ХУ на плоскости харак- 
теризуется вектором безусловных cpednuz: 


Mxy = (Мх, Му), 


где Mx, My — координаты центра рассеивания значений ZY; B 
области совмещения ХУ на плоскости. Аналогично этому сово- 
купности условных средних удобно записывать в виде векторов 
условных cpednuz: 


Мхуу = (Мхи, Мхи» o> MX/ym) + 
Мих = (Му, Myjes +--+) Муунь)› 


которые перечисляют координаты простых регрессий «Х по Узи 
«У по Х», характеризующих изменение «Х в среднем» при изме- 
нениях У и соответственно изменения «У в среднем» при измене- 
ниях Х. Заметим при этом, что безусловные средние суть мате- 
‘матические ожидания условных среднит: 


М, =М [Mxyy] = Py Mxjy + РьМхуь, + ---+ РУМхре, 
м, =М [My;x] = Pe,My/e, + Ре,Му», + --- + PeMy/ey, 


чем следует пользоваться для проверки вычислений. 
Рассейвание и связь (связность) в системе ХУ количественно 
характеризует ховариационная матрица: 


x и 
eee Dx  COVxy 
ХУ у \COVxy Dy Л 


в которой на главной диагонали записаны безусловные дисперсии, 
а внедиагональные элементы — ковариации; причем из-за переста- 
новочности умножения СОУух = СОУху, что подчеркнуто в ма- 
трице одинаковым порядком индексов ковариаций. 

Безусловные дисперсии в ковариационной матрице при неболь- 
шом числе значащих цифр в данных можно вычислять по мульти- 
множествам безусловных распределений: 


Dx = )>P(X?)- Mz, Dy => P(¥*)~ М}, 
x ¥ 


а ковариации — по мультимножеству (или матрице) совмещенного 
распределения: 


COVxy = У SO P(XY) - МхМу. 
ey 

Вектор безусловных средних и ковариационная матрица опре- 
деляют основные параметры системы ХУ в натуральном масшта- 
бе, т.е. в единицах производственных измерений. Но при норма- 
лизации распределений в психодиагностических или других целях 
необходимо избавиться от качественной специфики измерявшихся 
величин. Это достигается (линейным) преобразованием из нату- 
рального в стандартный (безразмерный) масштаб: 


(Х-Мх) : ох = {(=#- Мх) : ох}, 
(У - My): ду = {(у- Му) : oy}, 


где слева записаны матричные, а справа — скалярные формы пред- 
ставления случайных величин X иУ. 

В стандартном масштабе вектор безусловных средних стано- 
вится нулевым, так как величины центрируются — начало отсче- 
та переносится в центр рассеивания. Дисперсии в этом масштабе 
становятся равными единицам, а ковариация преобразуется в ко- 
эффициент линейной корреляции по формуле (3.19). Таким обра- 
зом ковариационная матрица преобразуется в корреляционную 
матрицу: 

д, Ш 


_Х [10 гху 
®ху-у (12 1,0 i} 


которая в стандартном масштабе оказывается единственной ха- 
рактеристикой двумерной случайной величины ХУ, правда, ха- 
рактеристикой линейной, так как обе регрессии независимо от их 
реальной формы изображаются прямыми линиями, пересекающи- 
мися в точке центра рассеивания под углом, пропорциональным 
коэффициенту корреляции как стандартизованному угловому ко- 
эффициенту регрессии — формула (3.22). Заметим, что корреля- 
ционную матрицу в практических расчетах легко получить из ко- 
вариационной матрицы, которая нормируется соответствующими 
произведениями стандартных отклонений: 


nek: (2% °=*)- 
x У 


охоу oF 
Ш: тху = СОУху: oxoy 
У \rxy 1= Dy: of 

При существенно нелинейных регрессиях (cM., напр., рис. 3.6, а) 
коэффициенты равны (или приближены) нулю, а связь между тем 
может быть значительной. Тогда корреляционная матрица долж- 
на быть заменена псевдокорреляционной матрицей, в которой за- 
писаны корреляционные отношения (3.15) 


x У 
а X (Ох nxjy 
mY \пу/х Dy 


и которая уже He симметрична, Tak Kak, согласно формулам (3.14) 
и (3.15), корреляционные отношения не только не перестановочны, 
но одно может близиться к единице, а другое — к нулю. 
Корреляционные отношения тоже можно определять на муль- 
тимножествах по распределениям. Сначала по условным распре- 
делениям рассчитываются векторы условных средних, приведен- 
ные выше, и векторы условных дисперсий: 
Expy = (Рхуьь» Оху» =, Dxivm) , 
Gy/x = (Буу»,, Оу, --., Оу»). 
Затем по векторам безусловных средних рассчитываются ducne- 
реми условных средниг: 
D [My;x] =М м] — МУ = 
= Pe, MY je, + Ре,Муу, + °° + Рьь Му „, — М, 
D [Mxyy] = M [My] - М = 
2 
= РьМа и + РьМху, +---+Р,-МАу,. - МХ 


и средние из условных дисперсий: 
Do [¥/zi] = М [yx] = Pe,Dyje, + Ру», +--+ PexDyjeys 
Do [Х/№] = М [@хиу] = PyDxjya + PysDxjya + --*+ PumDx/ym: 


После этого проверяется выполнение равенств (3.13), и по уравне- 
ниям (3.14) вычисляются коэффициенты детерминации, а по урав- 
нениям (3.15) — корреляционные отношения. 


1.1, ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ 
ВЕЛИЧИН ПО ДАННЫМ ЭКСПЕРИМЕНТА 


11 /. Аппроксимация простой регрессии 
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Одной из важнейших задач при обработке данных психологиче- 
ского эксперимента является аппроксимация регрессий. Аппрок- 
симация регрессии означает приближенное аналитическое (фор- 
мульное) выражение регрессии по ряду пар значений и; и 2 (i 
1,2,...,п), полученных в эксперименте. Благодаря аналитическо- 
му выражению, во-первых, становится возможной интерполяция, 
т.е. определение значений исследуемой величины, не изучавших- 
ся экспериментально, а во-вторых, и это главное, научные законы 
приобретают законченную математическую формулировку. 

Можно выделить три этапа аппроксимации простой регрес- 
сии: выбор функции &, вычисление неизвестных коэффициентов, 
проверка удовлетворительности аппроксимации опытных данных 
функцией &. 

1. Выбор аппроксимирующей функции во многом определяется 
знаниями и навыками исследователя и представляет собой сво- 
его рода искусство. Могут быть два гипотетических основания 
для выбора функции & определенного вида. Первое— это апри- 
орные сведения о законе, которому подчиняется изучаемая вели- 
чина (или аналогичные величины). Например, латентный период 
времени реакции для большинства разновидностей реакций подчи- 
няется закону Пьерона, (закону силы), что аналитически выража- 
ется гиперболой*; интенсивность ощущений по закону Вебера — 
Фехнера (логарифмическая функция), либо по закону Стивенса. 
(степенная функция)**. Второе основание — это вид сглаженной 


*Ломов Б.Ф. Человек и техника. M., 1966. С.43; Бойко Е.И. Время 
реакции человека. M., 1964; Шошоль Р. Время реакции// Эксперимен- 
тальная психология/ Под ред. П.Фресса и 2K. Пивже. М., 1966. 

**Пъерон А. Психофизика. Там же. 


(выравненной) от руки кривой на графике, где в координатах ZOU 
представлены эмпирические значения и; (см. рис. 3.7). 

Гипотезу о том, что выбранная функция пригодна для аппрок- 
симации, целесообразно попытаться проверить, прежде чем пе- 
реходить к вычислению неизвестных коэффициентов. Простей- 
ший способ проверки— приведение функции к линейному виду. 
Если регрессия в действительности линейна, то эксперименталь- 
ные точки на графике располагаются примерно по прямой линии 
(см. рис. 3.12). Если регрессия удовлетворяет логарифмическому 
закону, то в полулогарифмических координатах (logz)OU экспе- 
риментальные точки снова образуют прямую (с заменой перемен- 
ной): 

и = 00+, 
где @ = 106 =. 

При логарифмировании значений 24 и щ и обозначении их на 
графике в координатах (log z)O(log и) преобразуются в прямую ли- 
нию, рассмотренную выше: 

— степенная функция 


logu = |одал + №106, 
откуда, обозначая [оби =t, loga, =си log: = 9, получаем 
t=c+hd; 


— гипербола 
log u = logay — hlog z 
(см. рис, 3.9); 
— показательная функция 


log и = logay + zlogh; 
— экспоненциальная функция 
log u = log ay + 2 loge. 


Аналогичным путем проверяется пригодность и более сложных 
функций*. Но для парабол #-Й степени, включающих в себя не 
менее двух слагаемых при h > 2, этот путь не подходит. 

Чтобы определить степень A полинома (3.12), необходимую и 
достаточную для аппроксимации эмпирических данных, после- 
довательно вычисляют для равноотстоящих значений независи- 
мой переменной (2) конечные разности: Ащ +1 — первой степени, 
Д?и; +, — второй и так далее до А^щуь — й-Й степени, как в общем 
виде показано в табл. 3.3. Как только А” щук для некоторого h 


*Семендяев К.А. Эмпирические формулы. М.; Л., 1933. 
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Конечные разности К-Й степени 


Таблица 3.3 


Аа =| uy Дит А? и. 42 ААщ+ь 
const 
2 м < = - 
23 м2 Aug = и -щ = - 
23 us Aus = из — 12 А? из = Диз — Диз - 
% щ Аш = щ - из А? щ = Аш — Диз АРиь = OMe — OPT 
ana | щ-2 ns wi és 
aint Аш ща -щ 2 а es 
a uy Aus =u — 4-1 Puy = Au, — Au ы 
зн | ша | Aig = igs — ща = Аша - Aus 
20-3 | tn—3 . zs 
20-2 | naz | Ами-а = tna ~ unas oe ia 
21-1 | nai | Muna = Unat —tna2 | A?tin—1 = Aun—1 - Ачи-2 < 
an un Ain = Un — Unni А? ип = Aun — Atinas AP un = AMV — Abana 


при всех i становятся одинаковы*, эту степень и принимают для 
аппроксимации полиномом. 

2. Вычисление неизвестных коэффициентов регрессии можно 
осуществить несколькими способами. В частном случае линейной 
(либо приведенной к линейному виду) регрессии можно провести 
ана глаз» прямую линию через экспериментальные точки на гра- 
фике так, чтобы расстояния до всех точек были по возможности 
малыми. Затем непосредственно с графика (см. рис. 3.7) опреде- 
ляют свободный член и значения Az и Au, причем пара координат 
защ выбирается произвольно. Далее по формуле (3.11) вычисля- 
jor угловой коэффициент а. Этот способ можно назвать графо- 
аналитическим. При некотором навыке он обеспечивает хорошую 
точность аппроксимации. 

В общем случае используют способ (метод) наименьших ква- 
дратов, который основывается на том, что сумма квадратов от- 
клонений от среднего арифметического значения меньше, чем от 
другой величины, сколь угодно мало отличающейся от среднего 
арифметического: 


в 

Yui — uf)? = min, 

i=l 
где uj — Ее условное среднее, полученное эмпирически; и? — тео- 
ретическое значение условного среднего; # = 1,2,....п— количе- 
ство условных средних, полученных в эксперименте** 

Чтобы вычислить A+] неизвестных коэффициентов регрессии a; 
({=0,1,2,.._,А, включая свободный член), необходимо составить 
систему из h + 1 нормальных уравнений. Лля этого существует 
мнемонический способ, который заключается BA + 1-кратном по- 
вторении следующей процедуры. 

Пусть в общем случае для аппроксимации выбран полином 


и ay +12 +4522 4... + ал-1=”-Й + ав2^. 


Каждый +-й цикл (i = 0,1,2,...,№) процедуры состоит из двух ша- 
гов. 

Первый шаг. Исходное уравнение умножить на Ею степень ар- 
гумента: 


uz! = agz! + алла" + ааа? +. алая ф ава. 


Ha практике А»щуь не бывьют одинаковыми. Будучи нанесены на гра- 
фик, они флуктуируют вокруг горизонтальной прямой тогдь, когда h доста- 
точна для аппроксимации, но если, флуктуируя, они возрастают или убы- 
nator, значит, A еще не достаточна для аппроксимации. 

**При малом количестве наблюдений условные средние нельзя вычи- 
слить. Тогда и, —это сами наблюдьемые значения переменной И, a п— 
количество всех ньблюдений. 
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В результате преобразований получаем 
uz! = а02' + ал 4 аз? 4... Нави ав **. (3.23) 
Второй шаг. Результат первого шага (3.23) почленно подвести 
под знаки сумм (так как такие уравнения можно записать для ка- 


ждого из п условных средних uj), вынося неизвестные коэффици- 
енты за знаки сумм: 


n 
На), #2+...+ 


i=1 


Например, при № = 2 и ao > 0, a; > 0 имеем обычную параболу, 
‘уравнение которой 


и = dg +а12 +4227. 
В результате трехкратного применения изложенной процедуры 


получаем систему из трех нормальных уравнений (так как при 
i=02=1, 705% 


Беыбыь ва sas 


1 t= 


EE SEED en и 
i=l 

3. Проверка о pietBaidioeons аппроксимации опытных 
данных выбранным уравнением осуществляется путем вычисления 
коэффициента линейной корреляции между рядами эмпирических 
(u;) и теоретических (uj) значений регрессии: 


M 
r(u,u*) = Fg a (3.24) 
Ум "(ми - VER, (uz)? — пм] 
Если величина коэффициента корреляции оказывается недоста- 
точной, то следует выбрать другое аппроксимирующее уравнение. 
Пример 3.1. В экспериментах по изучению слежения с пресле- 
дованием, выполняемого человеком, измерялось латентное время 
реакции в зависимости от скорости движения цели*. Результаты 
приведены в первых двух столбцах табл. 3.4. 


“Lens начинала движение мгновенно и двигалась равномерно с некото- 
рой скоростью (Суходольский Г.В. О характеристиках человекь при 
слежении: Автореф. канд. дис. Л. 1968). 


Таблича 3.4 
„Данные для расчета регрессии к примеру 3.1 


18 

30 

40 

48 

54 068 

60 560 063 

65 722 6,060 

70 0,056 

00 0,040 
200 30 0,020 

=I 17,31 | =16,15 31,64 5,32 


теоретические средние арифме- 
тические значения латентного времени реакции, с, г, — скорости движения 
цели, мы/с- 


Примечание: м, — эмпирические, uf 


Предположив, что величина скорости движения цели действует 
на реакцию испытуемого аналогично тому, как действуют вели- 
чины стимулов других модальностей, можно думать, что искомая 
зависимость аналогична закону Пьерона. Следовательно, аппрок- 
симирующая функция должна быть гиперболой. Такое предполо- 
жение верно, если логарифмы латентного времени реакции в зави- 
симости от логарифмов скорости образуют на графике ряд точек, 
флуктуирующих около прямой линии. Действительно, на рис. 3.9 
точки с координатами (Ig 2+, lg us) — см. табл. 3.4 — группируются 
около прямой линии. Таким образом, исходной аппроксимирую- 
щей функцией может быть гипербола. 

Остается разобраться еще в одном вопросе. В формуле закона. 
Пьерона 

а 
Т=т+т 
имеется свободный член (то), который выражает «несократимый» 
компонент латентного времени реакции. Это означает, что даже 
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Puc. 3.9. Зависимость латентного времени реакции uj, с, от 
скорости движения цели =, м/с. 
По оси абсцисс —182;, по оси ординат —15 щ. Точками обо- 
значены экспериментальные данные. 


при «бесконечно большой» интенсивности (I) стимула г = 79 > 0. 
При классической методике измерения латентного времени реак- 
ции, когда отсутствует возможность антиципации момента появле- 
ния стимула, это в действительности так. Но в условиях перио- 
дичности предъявления стимула имеется возможность обучиться 
антиципации момента появления стимула, в результате то может 
быть нулевым и даже отрицательным*. В нашем случае эта ситу- 
ация как раз и имела место. В частности, при бесконечно большой 
скорости движения цели** латентное время реакции в среднем со- 
ставляло 0,03 с. Таким образом, для наших экспериментальных 
условий аппроксимирующая гипербола должна быть без свобод- 
ного члена: 


а 
“=, 
где и — среднее арифметическое значение латентного времени ре- 
акции, с; =— скорость движения, мм/с; h и а— неизвестные коэф- 
фициенты, которые и следует вычислить по данным эксперимента. 

Для вычисления коэффициентов используем метод наименьших 
квадратов. Логарифмируя исходную гиперболу, получаем урав- 
нение прямой: 

15и = ща- №152. 


“Бойко Е.И. Время реакции человека. M., 1964. С.17. 
**Это достигалось экспериментально одновременным исчезновением це- 
ли в одном месте и ее появлением в другом. 


В соответствии с рассмотренной процедурой составляем систему 
из двух (по числу неизвестных коэффициентов) нормальных урав- 


‘нений: 
20 20 
Уи = 20lga—h в, 
ist 


i=l 


20 20 20 
Уши вн) = ща) lex — bY вн)". 
ia i=l =I 
Необходимые значения Ig zi, Igui, Igulgz, (Igz)?, а также всех 
сумм, входящих в нормальные уравнения, представлены в 
табл. 3.4. 

Записав систему уравнений в явном виде, решим ее способом 
исключения переменной (умножим первое уравнение на 17,31, вто- 
рое— на —20 и сложим почленно): 

—16,15=204а -17,31h| 17,31 
—22,00 = 17,31 lga—31,64h| -20  * 
—279,5565= 346, 2lga—299, 6361h 
440, 0000 = —346, 21ga +632, 8000h ; 
160, 4435 = +333, 16391 


An 160, 4435 

333, 16 
2016а = 17,31 - 0,481 — 16, 15 = —7, 82, 
—7,82 


= 0,481, 


= —0,391. 


ща= 


20 

Учитывая значительное рассеивание экспериментальных точек и 
по соображениям удобства, округлим: h = 0,5 и!8а = —0,4. Тогда 
искомое уравнение регрессии в логарифмической форме имеет вид 
(рис. 3.9): 


Igu’ = -0,4—-0,5lgz. 
Потенцируя, окончательно получаем 


при 0,1<2< 200 (мм/с). 


Для проверки удовлетворительности аппроксимации вычислим 
по формуле (3.24) коэффициент корреляции r(u, и") (промежуточ- 
ные величины представлены в табл. 3.4 и 3.5): 

3,4199 — 20 - S354. 02 


т(и, м") = = 
3,4559 — 20-581" - \/3,5025 — 20. S55 
р = 0,97. 


Отредактировал и опубликовал на сайте 


Таблуща 3.5 


Промежуточные величины для расчета ноеффициента 
корреляции к примеру 3.1 


1 

2 0,7921 | 0,9612 
3 0,3969 | 0,3591 
4 0,2704 | 0,2912 
5 0,2025 | 0,2340 
6 0,0784 | 0,0616 
т 0,0400 | 0,0480 
8 0,0256 | 0,0416 
9 0,0196 | 0,0210 
10 0,0169 | 0,0208 
и 0,0100 | 0,0080 
12 0,0081 | 0,0090 
13 0,0064 | 0,0056 
14 0,0054 | 0,0022 
15 0,0046 | 0,0054 
16 0,0040 | 0,0050 
17 0,0036 | 0,0030 
18 0,0031 | 0,0067 
19 0,0016 | 0,0024 
20 0,0004 | 0,0006 
И 3,5025 3,4199. 


Итак, уравнение и* = 0,4-2~%* можно рассматривать в качестве 
реализации закона Пьерона для нашей экспериментальной ситуа- 
ции. 

Пример 3.2. При изучении эффективности вычислений, осу- 
ществляемых человеком вручную, было установлено, что затра- 
ты времени на вычисления определяются не спецификой арифме- 
тических действий, а количеством элементарных операций (сум- 
мирование, вычитание, умножение и деление в пределах одного 
десятичного разряда, а также переход из разряда в разряд)*. В 
экспериментах с опытным вычислителем, который суммировал на, 
счетах столбцы специально подобранных чисел, были получены 
оценки среднего времени суммирования, соответствующие пере- 
менному количеству элементарных операций (2+) сложения и пере- 
хода из «младших» десятичных разрядов в «старшие». Результа- 


*Кандарацкова Н.М. Суходольский Г.В. Об эффективности 
и надежности лементарных вычислительных операций// Экспериментьль- 
ная и прикладная психология/ Под ред. Б.Ф. Ломова. Вып. 1. Л. 1968. 
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ты представлены в табл. 3.6. В нижней строке таблицы приведены 
условные средние значения времени суммирования (М [и/2;]). 


Таблица 9.6 
Время суммирования (м, с), к примеру 3.2 
x Количество ьлементарных операций (2) 
измерения 
8 т | 36 | 121 | 129 | 152 | 183 
1 7 7o| 85| 90] 90 | 150| 210 
2 8 55 | 75 | 105 | 105 | 150 | 180 
з 6 50| 90| 85 | 105 | 125 | 190 
4 = $5) 75] 90) 110 | 150 | 150 
5 - 50| 75| - | 105 [15| 160 
6 - 45| 70} —|105| -| 210 
Сумма | 21 325 | 470 | 370 | 620 | 690 | 1100 
МЬ/=] | 7 s4| 78| 92 | 103 [138 | 183 


Примечание. Хронометрьж выполнен с точностью до се- 


кунды, поетому условные 
ап Ми/ =]. 


средние округлены до 


целых: 


Чтобы выбрать аппроксимирующую функцию, нанесем значе- 
ния (M[u/2], 2) на график и от руки проведем монотонную кри- 
вую, лежащую, по возможности, вблизи всех экспериментальных 
точек (рис. 3.10). Заметим, что при этом естественно считать и = 0 


приё=0. 


Рис. 3.10. Регрессия среднего време- 
ни суммирования, полученная 
сглаживанием «от руки». 

По оси абсцисс — количество елемен- 
тарных операций суммирования; по 
оси ординат — время, с. Крестика- 
ми обозначены эмпирические дан- 
ные, кружками «выравненные» 
значения среднего времени. 


140) 


140 180 


o 20 60 


По внешнему виду полученная кривая напоминает параболу hy 
степени. Проверяя это предположение, определим конечные paz 
ности h-ro порядка (см. табл. 3.3). Непосредственно по эмпири, 
ческим данным этого сделать нельзя, так как разности значений 
аргумента (Az;) неодинаковы по величине. Поэтому выберем Ho. 
вые значения 2; и соответствующие MM «выравненные» Up, которые 
снимем непосредственно со сглаженной кривой (рис. 3.10, Kpyx- 
ки). Эти значения, а также вычисленные по ним конечные разно- 
сти представлены в табл. 3.7. Можно видеть, что разности второй 
степени группируются вокруг горизонтали. Таким образом, в Ka- 
честве исходной аппроксимирующей функции подходит обычная 
парабола без свободного члена: 


zi + а2?, 
где uy и 2 определены экспериментально (i = 1,2,...,11), abu 
а— неизвестные коэффициенты, которые следует вычислить. 


щ 


Таблица 3.7 
Приращения h-ro порядка при определении 
степени полинома, необходимой и достаточной для 
аппроксимации эмпирических значений 
среднего времени суммирования 


Количество «Выравненные» | 
Флементарных | значения среднего 
операций | времени суммирования | Aug | Д?иь 
(=) (us) 
о о -| = 
10 5 5 - 
20 10 5 о 
30 16 6 1 
40 24 8 2 
50 30 6 =? 
60 38 8 2 
70 46 8 о 
80 55 9 1 
90 64 9 о 
100 73 9 0 
110 83 10 1 
120 92 9 = 
130 105 13 4 
140 118 13 о 
150 132 14 1 
160 146 14 о 
170 160 14 о 
180 178 18 4 


Система нормальных уравнений для вычисления а и b по мето- 
наименьших квадратов получается применением рассмотрен- 


ной процедуры: 
ty Е п 

Yu =b)o5 +a>> ty 

1 va 21 

У ние: 


ist = 


Промежуточные величины и их суммы представлены в табл. 3.8. 
Подставляя их в уравнения, запишем систему в явном виде: 


759 = 9116 + 109 619а, 
95 333 = 109619 + 15 226 181а. 


Таблица 3.8 
Данные для расчета регрессии к примеру 3.2 


ны | 8 2 |ы 
56 64 512 5 
156 169 2197 8 
486 729 19683 18 


1134 | 1764 74088 | 29 
3174 | 4761 | 328509 | 51 
3834 | 5041 | 357911 | 53 
7488 | 9216 | 884736 | 76 
11 253 | 14641 | 1771561 | 102 
13287 | 16641 | 2146689 | 111 
20976 | 23104 | 3511808 | 137 
33489 | 33489 | 6128487 | 176 


95333 | 109619 | 15226181 | - 


Решение проведем способом подстановки. Из первого уравне- 
ния находим 


I 
b= 2179 - 109 619а) 


и подставляем во второе уравнение: 


95333 = 517 109619(759 — 1096194) + 15226 1814; 
911-95 393 = 15226 181 - 91a + 109619 -759 — 109619?а; 


86 848 363 = 13 871 050 891а + 83 200 821 — 12016 325 161а; 


3647542 
“= 1854725730 ® 0,002; 
b= дея 109619 0,002) = 0,6. 
Следовательно, искомая регрессия выражается уравнением пара- 


болы: 
u® = 0,62 + 0,002:?. 


‘Tak как измерения времени выполнены с точностью до | с, то 
теоретические значения среднего времени на суммирование окру- 
глим до целой части и! = ant {и*}. Определив по формуле (3.24), 
что г(и, и") = 0,97, можно говорить об удовлетворительной ап- 
проксимации. Отметим, что при = = 1 (имеется всего одна элемен- 
тарная операция сложения) полученная регрессия дает средние 
затраты времени 0,6 с. Это совпадает с результатами измерений 
в других опытах*. 
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Pad Определение числовых характеристик при небольшом количестве экспериментальных данных 


В психологической практике нередко количество пар значений 
ти изучаемых случайных величин Х и У, наблюдавшихся в экс- 
перименте, составляет несколько десятков. При таком небольшом 
количестве экспериментальных данных нельзя определить эмпи- 
рические функции распределений, но можно вычислить оценки 
всех числовых характеристик двумерной системы, что оказывает- 
ся полезным для планирования фундаментальных исследований. 

Можно выделить два случая. Первый — количество наблюде- 
ний п < 30, при этом можно вычислить только безусловные сред- 
ние арифметические и дисперсии, а также коэффициент линейной 
корреляции и через него — коэффициенты регрессии. Здесь, одна- 
ко, невозможно решить, линейна или нелинейна корреляция, а по- 
тому использование линейных корреляционных мер не обоснова- 
но и может дезинформироваль исследователя, если величина гху 
окажется близкой к нулю. 

Расчет перечисленных мер при п < 30 (а при необходимости— 
при любом п) осуществляется последовательно. Сначала вычи- 


*Кандарацкова Н.М. Суходольский Г.В. Об эффективности 
и надежности элементарных вычислительных операций// Эксперименталь- 
Maa и прикладнья психология/ Под ред. Б.Ф. Ломова. Вып.1. Л., 1968. 
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сляются безусловные средние арифметические 


MX] = а 


ig 
м] =. 
i=l 
Далее вычисляются безусловные дисперсии и стандартные откло- 
нения: 


о = 1532 -(мру», of] = VOR 


ри = + - (м, of] = МБ. 


Ковариация здесь определяется по формуле 
iw 
COV[XY] = nat — M[X]M[¥], (3.25) 


после чего по формуле (3.19) рассчитывается коэффициент корре- 
ляции и по формулам (3.22) — коэффициенты линий регрессии. 

Второй случай — количество наблюдений в пределах 30 < п < 
200*. Здесь уже можно осуществить простейшую группировку 
данных, что позволяет решить вопрос о форме корреляции и опре- 
делить в явном виде регрессии и корреляционные отношения. 

Группировка в этом случае состоит в том, что области наблю- 
дения переменных Х и У’ квантуются на произвольной величины 
интервалы Ах и Ду, число которых должно быть не меньше 4-5. 
Экспериментальные данные разносятся в таблицу (см. табл. 3.11), 
после чего подсчитываются частоты /; — переменной Х принять 
значение на Ё-м интервале Ах (i = 1,2 т) и f; — переменной 
У принять значения на 7-м интервале Ay (j = 1,2,...,Ё). Далее 
осуществляются вычисления: 

— условных средних арифметических 


В Lh 
мые) = Zot Ми) = рост» 826) 


xt gol 


*При n > 200 можно осуществлять обычную группировку и вычислять 
распределения (см. 3.3.3). 


где {— номера значений y;, наблюдавшихся совместно со значе- 
HMAMM 2; на i-M интервале Ах; 9 — номера значений 2+, наблюдав- 
шихся совместно со значениями у; на j-M интервале ly; Ли fj 
определены выше; 

— координал «привязки» для условных средних арифметиче- 
ских 


(3.27) 


rae Е(2;) — среднее арифметическое значение величины Х Ha i-M 
интервале Ах, которому соответствует условное среднее M(y/z;); 
Е(у;) — то же для каждого условного среднего M(z/y;). 

Полученные точки с координатами {E(z;), M(y/z;)} служат осно- 
вой для определения регрессии «У по Х», а точки с координата- 
ми {M(z/y;), Е(у;)} — для определения регрессии X по У, которые 
далее подлежат аппроксимации. После определения ау/; И ах/у 
(в линейном случае) коэффициент корреляции вычисляется через 
них по формуле (3.20). 

Вычисление безусловных средних арифметических можно те- 
перь осуществить через условные средние: 


му] = Уомеигол, 


i= 


ie (3.28) 
MIX] = — 3° M(z/y;)fj 
j=l 
Далее вычисляются все необходимые дисперсии: 
— безусловные, как и в первом случае; 
— дисперсии условных средних: 
12 
D[M(y/2i)] = = > (M(v/2s) - МУ fi, 
к т (3.29) 
DIM(2/y)] = = D> (M(2/w) — МХ Л; 
ja 
— остаточные дисперсии: 
12 
Dolv/2i] = = У Div/zd hi, 
i (3.30) 


О 
раем = СВЕ, 


где п = Ум = Djs 
условные дисперсии У по Х; D[z/yj] 
условные дисперсии Х по У. 

В итоге по формулам (3.14) вычисляются корреляционные отно- 
шения, а по формуле (3.17) — коэффициент детерминации. 

Пример 3.3. В плане комплексного исследования личности у 
студентов психологического факультета определялся социометри- 
ческий статус на курсе (У) и в своей учебной группе (Х). Ре- 
зульталы представлены в табл. 3.9. Определим количественные 
характеристики двумя способами. 


Да Div/zd) = БУ, - Ми) — 
ры 2, - Мер — 


Таблица 3.9 


Исходные данные к примеру 3.3 
У — социометрический статус нь курсе, 
Х — социометрический статус в своей группе, % 


у x Y x у x 
48 T 45 э | 8 7 
-9 -9 23 8 73 19 

100 22 64 15 23 2 
= | -и и 4 23 6 
4 -6 -18 -8 is | 17 
14 -0,5 м -0,7 1 7 
14 5 -u | -5 26 8 
и 9 60 8 14 4 

-28 Г за 8 81 7 
46 2 п -2 23 9 
42 и —47 -—28 и 4 
27 15 40 2 49 0,5 
19 -8 Е 15 26 8 
83 о 20 | -ю и 9 


Для вычисления безусловных средних, дисперсий и ковариации 
по формуле (3.25) необходимы квадраты Х? и У*, произведения 
ХУ, а также их суммы и суммы исходных данных. Эти величины 
приведены в табл. 3.10; по ним вычисляем: 


р _ 104 _ 1403 «ey. 
Ми = 125, М" 2 3,34; 
ppv] 8 25 жа, О = 780.9 _ 3, saw 91; 


o[Y] = 28,8, o[X] = 9,54; 
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10780,3 


COV[XY] = — 25-3, 34 == 173, 2; 


По формулам (3.21) 


ау] = 1132 21,9, аз), = №32 = 0,21. 


Таблица 5.10 


К расчету коэффициента линейной корреляции. 
по несгруппированным данным 


у | x? [ух] и | x |v] x УХ 
2304 1 48 60 8 3600 64 480 
81 81 81 34 8 1156 64 272 
10000 | 484 2200 и -2 121 4 —22 
1) 121 ll] -47 | -28 2209 | 784 1316 
196 | 36 -84 40 2 1600 4 80 
-0,5 196 0,25 -7 31 15 961 225 465 
196 25 70 20 | -10 400 100 200 
121 81 99 8 4 64 16 32 
784 о о 73 19 5329 361 1387 
2116 4 92 23 2 529. 4 46 
1764 | 121 462 23 6 529 36 132 
729 | 225 405 15 17 225 | 289 255 
361 64 152 1 к 1 49 7 
6889 о о 26 8 676 64 208 
2025 | 81 405 24 4 196 16 56 
529 | 64 184 81 7 6561 49 567 
4096 | 225 960 23 9 529 81 207 
121 16 44 и 4 121 16 44 
324 | 64 144 49 0,5 | 2401 0,25 24,5 
0,7 196 0,49 | -9,8 26 8 676 64 208 
121 | 225. 165 и 9 121 81 99 
Суммы 1041 | 140,3 | 61155 | 4289,99 | 10780, 3 


Прежде чем группировать экспериментальные данные, постро- 
им на графике поле корреляции, а затем, как это сделано на 
рис. 3.11, расчленим его на интервалы, по возможности соблюдая 
два условия: 1) границы проходят между точками, 2) в каждом 
интервале оказываются два и более значений (иногда крайнюю 
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точку можно оставить и одну). Значения границ интервалов сни- 
маются прямо с графика и записываются, как показано в «шапке» 
табл. 3.11. Таким образом, поле корреляции в нашем примере ока- 
зывается расчленено на т = 4 интервала Ах и на k = 7 интерва- 
лов Лу. 


0 
90 
70 
50 
Pus. 3.11. Поле корреляции к при- 
меру 3.3. 50 
По оси абсцисс — значения социо- 


метрического статуса в своей груп- 10 
ne (zy), по оси ордин = 
социометрического статуса на кур- ыы 
ce (у,). Точками обозначено совмест- 39 
ное появление пар значений zy). 
Интервалы группировки, выделен- 50 
вые пунктиром, как в табл. 31, 


— значения 


-30 -20 0 0 10 20 


Группировку данных производят так. Из табл, 3.9 последова- 
тельно выбирают пары значений уу; и записывают в табл. 3.11 на 
пересечении соответствующих интервалов AyAy: значение у; — 
в нижнем треугольнике, а значение 2; — в верхнем треугольнике. 
Окончив разноску, подсчитывают частоты fj по столбиам и /; по 
строкам. Ilo столбцам и строкам табл. 3.11 определяются и услов- 
ные средние, и соответствующие им координаты «привязки». На- 
пример, по первой строке и формулам (3.26) и (3.27) вычисляем 


M(z/vs) = 1-8) + (-18) + (-28) + (01 = 18, 


Е(и) = СС) + (-47) + (-28)] = -26. 


Нанесем значения условных средних на график с координата- 
ми E(y;) и Е(2;) (рис. 3.12) и определим коэффициенты регрессий 
графоаналитическим способом. По линейке проведем прямые на 
графике так, чтобы расстояния от экспериментальных точек бы- 
ли по возможности наименьшими. В частности, регрессия У по Х 
(сплошная линия на рис. 3.12) проводится через три крестика, a 
регрессия Х по У (пунктир на рис. 3.12) — через кружок с коор- 
динатами (0, —2) и через середину расстояния между кружками с 


Табльца 3.11 
`Двумерная группировка и условные средние при небольшом числе наблюдений (40 = 200) 


—0,5, 5,4, -0,7, 
14, 14, -2,2,4,4 
14,11, 
14, 11, 11,23 

1,2, 2,05 
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координатами (79, 9) и (100, 22). Теперь по графику можно с прие- 
млемой точностью определить коэффициенты регрессий: by = 18 
для регрессии У по Х, так как в этой точке сплошная линия пере- 
секает ось ординал; bx = —2 для регрессии Х по У, так как в этой 
точке пунктирная линия пересекает ось абсцисс. 


Poe. 3.12. Линии регрессии к при- 
меру 3.3. 

По оси абсцисс — значения социо- 
метрического статуса в своей груп- 
пе (z4), по оси ординат — эмачения 
социометрического статусь на кур- 
се (у›). Крестиками обозначены 
усповные средние M(2/y,), круж- 
ками — условные средние М(у/з,). 
Сплошная линия — регрессия у = 
22 + 18, пунктирная — регрессия 
2 =0,2y—2. 


Можно видеть, что значения угловых коэффициентов 


a, = Au _ 10-30 _ 
У Ae 26-6 
Az_ 12-4 


ayy = == = 0,2, 

tly = Лу 170-30 
полученные графоаналитическим способом, мало отличаются от 
вычисленных через корреляцию: 


1 = вла = 0.2.2 = 0,63. 


Необходимо отметить, что графоаналитический способ не следует 
применять для точных расчетов при значительном разбросе эмпи- 
рических условных средних и при нелинейностях. 

Итак, аппроксимированные регрессии имеют вид 


у" =224+18 и #*=0,2у-2, 


где у’ — теоретическое среднее значение статуса на курсе при 
условии, что статус в группе имеет значение 2; 2” — теоретическое 
среднее значение статуса в учебной группе при значении статуса 
ка курсе у. 


Займемсявычислением коэффициентов детерминации. Для рас- 
чета зу, и 2), необходимы значения M[Y] и M[X], которые опре- 
делим по формулам (3.28) и данным табл. 3.11: 


M[Y] = ppll-4)-8+24- 15 +31 - 13+ 52-6) ~ 25, 


MIX] =25((-18)-44(-2)-444-2046-8411,5-24 
+9.3+22. 193,3, 


Что совпадает с ранее вычисленными значениями. Безусловные 
дисперсии получены выше: D[Y] = 831 и D[X] = 91. Используя 
формулы (3.29), рассчитаем дисперсии условных средних (проме- 
жуточные величины приведены в табл. 3.12 и 3.13): 

11585 


D[M(y/zi)] = y= = 275,83 


1824, 88 
DIM(z/y)] = = = 43,45. 


Затем по уравнениям (3.14) вычислим и коэффициенты детермина- 
ции, и корреляционные отношения. 

Коэффициент детерминации статуса на курсе статусом в своей 
группе составляет 


откуда соответствующее корреляционное отношение Ny/z ^ 0, 57. 
Коэффициент детерминации статуса в группе статусом на курсе 
составляет 
‚ _ 43,45 


"ely = 91 


= 0,477, 


откуда корреляционное отношение п; уу = 0, 69. 
Осуществим проверку найденных значений, вычислив коэффи- 
циенты детерминации через остаточные дисперсии (формулы 3.30): 


Dolw/2i] = 563,47, тогда jj, =1— SHAT 0,30; 


Го] = 47, тогда 1, =1- a 0,48. 


Следовательно, результаты вычисления правильны. 

Сопоставляя ранее вычисленное значение коэффициента корре- 
ляции (r = 0,63) с корреляционными отношениями, можно видеть, 
что в рассматриваемом случае 


7 =0,5 (nye + Nefy) - 


Таблица 9.12 
Промежуточные величины к расчету 7. 


[ам [Tan ам 


-29 841 
-1 1 
6 36 
a7 729 


Примечание. AM = M(y/z,) — МГУ}. 


Таблица 5.13 
Промежуточные величины « расчету 73), 


Примечание. АМ = M(z/y) — MIX]. 


Это свидетельствует о случайности различий между козффициен- 
тами детерминации и о хорошем приближении корреляции к ли- 
нейной, 

В заключение, интерпретируя полученные результаты, под- 
черкнем различия между коэффициентом детерминации как мерой 
тесноты связи и коэффициентами регрессии, характеризующими 
скорость изменения средних значений одной случайной величины 
при изменении другой. Так как односторонней обусловленностью 
из-за недостоверности различий лу’, и jy можно пренебречь, то 
можно считать, что между статусом студента на курсе и в группе 
сушествует взаимосвязь почти в половине случаев: 


12): = 0,33 < г? < ту, = 0,48. 


Однако для этой доли случаев относительное (в единицах стан- 
дартного отклонения) изменение среднего статуса на курсе при из- 


менении статуса в группе осуществляется в десять раз 
(ау/=: г/у = 10) интенсивнее, чем относительное изменение сред- 
него сталуса в группе при изменении статуса на курсе. Разумеет- 
ся, эта предположительная интерпретация требует дополнитель- 
ной экспериментальной проверки. 


}.1 1, Полный расчет количественных характеристик двумерной системы 
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Чтобы полностью количественно охарактеризовать систему из 
двух случайных величин Х и У, необходимо иметь большое число 
экспериментальных данных: минимально п > 200 пар значений 
aiyj. Лля вычисления характеристик распределения требуется 
осуществить двумерную группировку данных, которая в принципе 
выполняется по тем же правилам, что и одномерная группировка. 
Для каждой из величин определяют интервалы квантования (Лх и 
Ay), причем нужно, чтобы количество интервалов (k) было одина- 
ковым для Х иУ; обычно k = 8 + 12. Затем определяют отдельно 
для Х и У границы и средние значения интервалов, которые запи- 
сывают в «шапку» группировочной таблицы (см. табл. 3.14). Же- 
лательно выбирать границы так, чтобы среди экспериментальных 
данных «граничные» значения отсутствовали. 

Факт появления пары значений совместно на интервалах Ax 
и Ay кодируют в пятеричной системе, как это делалось прежде. 
Окончив кодирование, подсчитывают частоты совместного по- 
явления (/,;), затем — количество сгруппированных наблюдений*: 


к Е 
Nah ius 
sty 


и частости совместного появления значений г2;у; на любой паре 
интервалов Ax и Лу, где fi; > 0: 


Sis 
fs, 


Далее определяют безусловные эмпирические вероятности рас- 
пределений У иХ: 


Р. 


у 


*В ходе кодирования несколько значений может быть потеряно или оши- 
бочно приписьно, поетому п # №. 
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а после этого — условные эмпирические вероятности распределе- 
ний =/у; и у/т:: 
P, 


Bi 
Py = ah, P= 
и; PB aft 


Совокупности перечисленных вероятностей, сопоставленные со- 
ответствующим значениям переменных, образуют эмпирические 
распределения, полностью характеризующие двумерную систе- 
му*. 

Для расчета числовых характеристик по распределениям ис- 
пользуют упрощенные методы, основанные на линейном преобра- 
зовании исходных величин Х и\У: 


„_ 1 - Ах » _ 4 — Ay 

=——— М =—— 3.31 

Te Я ва 

где Ах и Ау — условные начала отсчета, выбранные вблизи пред- 

полагаемого центра рассеивания. С учетом преобразований (3.31) 

расчетные формулы можно представить следующим образом, 
Для безусловных средних: 


M[X] = Ах +Axm, (3.32a) 


где величина пу’ определяется тремя способами: 


(3.326) 
(3.33a) 
(3.336) 
Для условных средних: 
k 
M(z/y;) = Ax +x D> Ул (3.34а) 
и 
* Py 
M(y/zi) = Ay + Ay ae (3.346) 


"В дальнейшем все эти эмпирические данные должны аппроксимиро- 
ваться теоретическими функциями распределения, что в принципе анало- 
гично одномерному случью, но выходит за рамки нашего изложения. 


Для безусловных дисперсий: 


РУ] = У, 
где 
ОУ) = Dy (yj)? Ps — (mp) 
: #1): 
D[X] = №01}, 
где 


О Е 
= (27)? Py — (ти. 


Для дисперсий условных средних: 


D[M (2/y;)] = AX D! [M(z/y;)], 


rae ы ‘ ea 3 
D'[M(z/y,)] = >> (=r) Pj - (ту), 
= 
и 
D[M (5/21) = 4} D! [M(y/zi)], 
rae 


; 
мои = 35 (= wt) P,— (mp)? 


=: \; 


Для остаточных дисперсий: 


Do [z/uj] = A D'[z/y;], 


где 
| 
Dé [2/y] = rol Xf)? Py - 
- ft j= > 
Do [м/=4] = ХУ D'[y/zs), 
где 


k С 
ыы = 3-7 


у isl 


(ews 


(3.35a) 


(3.356) 


(3.36a) 


(3.366) 


(3.37а) 


(3.376) 


При сопоставлении уравнений (3.35) — (3.37) можно видеть, что. 


выполняются равенства: 


5'[Х] = D’[M (z/y,)] + Di [2/y) 
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и 
РУ] = D’[M (/25)] + В. [y/zi , 
поэтому коэффициенты детерминации равны 


2 _ D'IM(e/y)) | _ Dale/yi) 
"ev DIX] 7 Я, 
wa, Ма _ 

«= Г > 


Аналогично в преобразованных величинах выражается коэффи- 
‘‹циент корреляции: 
COV'[XY] 


7 Rp Ty) (3.38) 


& Е 
COV'[XY] = УС, Ру — тхту, (3.39) 


isi jet 


где 


и коэффициенты регрессии: 
Ay COV'[XY] 
aia Di . 
a, = AXCOV'IXY] 
y= БТ] 

Пример 3.4. При изучении амплитудно-частотных характери- 
стик руки человека в условиях направленного уменьшения и уве- 
личения амплитуды совместно регистрировались значения полу- 
периодов (У) и амплитуд (Х) колебаний руки, Результаты одного 
из испытуемых сгруппированы в табл. 3.14. Обработку экспери- 
ментальных данных намнем с вычисления частостей совместного 
распределения значений полупериодов (У) и амплитуд (Х), без- 
условных распределений, средних арифметических, дисперсий и 
коэффициента корреляции. 

Частости совместного распределения (р:;), представленные в 
табл. 3.15, вычислены с округлением до одной тысячной так, чтобы 
выполнялось условие 5.12, THE: ру = 1. Суммируя ру по строкам 
(по i), определим безусловные частости ру, совокупность которых 
в сопоставлении совокупности интервалов группировки Лу обра- 
зует ряд безусловного распределения значений полупериодов У; 
заметим, что Daw = 1. Суммируя частости ру; по столбцам (по 
Jj) табл. 3.15, определим безусловные частости ру, вместе с совокуп- 
ностью интервалов группировки Ах образующие ряд безусловно- 
го распределения значений амплитуд Х; очевидно, что j=) Pi 


(3.40) 


Таблица 9.14 
Исходные данные к примеру 3.4 
=; — границы интервалов группировки амплитуд, MM, Ax = 15; 
у; — границы интервалов группировки полупериодов, мм, Лу = 0,7мм; № = 213 


= 
82,5 | 97,5 | 112,54 
97,5 | 12,5 | 177,5 
1 1 1 ] 
1 14 1 1 
5 17 7 4 2 
5,05 = 5,75 2 9 4 5 1 
5,75 45 1 8 7 5 3 3 1 
6,45+ 7,15 = 3 5 6 3 3 
7,154 7,85 1 2 3 2 - 4 4 3 
7,854 8,55 1 1 1 4 1 9 п 1 
8,55 49,25 1 3 и 3 
9,25 9,95 2 1 1 1 
9,95 + 10,65 2 2 2 
10,65 + 11,35 1 2 1 


Таблица 3.15 
'Частости совместного распределения значений (р,;) полупериодов (у) м амплитуд (=) 
и промежуточные величины к расчету безусловных средних, 
дисперсий и коэффициента корреляции 


= 15 Hh 30 | 45 | 60 | 75 | 90 | 105 | 120 | 135 | 150 | 165 | 180 
ти 

у |н ‘| -5 —4 -3 -2 -1 о 1 2 3 4 5 6 
ans 

3,3] -5 | 0,005 | 0,005 | 0,005 - 

4,0| —4 | 0,005 | 0,066 | 0,005 | 0,005 

47| -3 0,023 | 0,080 | 0,033 | 0,019 | 0,009 

54| -2 0,009 | 0,042 | 0,019 | 0,023 | 0,005 

61| -1 0,005 | 0,037 | 0,033 | 0,023 | 0,014 | 0,014 |0,005 

68} 0 - | 0,014 | 0,023 | 0,033 | 0,028 |0,014]0,014 

15| 1 0,005 | 0,009 | 0,014 | 0,009 | — |0,019/0,019]0,014 

82| 2 0,005 | 0,005 | 0,005 | 0,019 |0,005|0,0420,051|0,005] 

89! 3 0,005 Jo, 005]0, 014]0, 051/0, 014 

96] 4 (0, 009}0, 005}0, 005}0, 005| 

10,3] 5 (0, 003}0, 009/0, 009} 

11,0] 6 0, 0050, 009/0, 005} 
Pi 0,010} 0,094 , 0,06610, 057 0, 10816, 139[0,038| 

lp. ~0,050|-0, 376|~0, 312|--0,244| 0,099] 0,000 | 0,066] 0, 132 |0, 2710, 4320, 6950, 2: 

gg Ys Po 0,205] 1,388] 0,966] 0,587] 0,309] 0,230 | 0,063] 0,135 |0, 233]0, 789|1, 306)0, 631 

И xi'vi'pis | 0,225] 1,432) 0,924| 0,470] 0,109] 0, 000]—0, 005) 0,078 |0, 2250, 9601, 940|0,882] 
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Пользуясь методом, рассмотренным в параграфе 3.1, можем опре- 
‚делить частости кумулятивной призмограммы совместного рас- 
пределения р; (Х < 25 У < yj), суммируя для любой пары значе- 
ний Z;yj все частости р;;, расположенные слева и сверху от иско- 
мой и на ее месте. Например, по данным табл. 3.15 


pi (X < 45, У<4) = 
= 0,005 + 0,005 + 0,005+0,005 + 0,006 + 0,005 = 0,091. 
«Граничные» слева и снизу частости 
РУ(Х <a, Y <yj)=pi(X <x), 
а «граничные» справа и сверху частости 
my (X <, У<и)Ер(У Sy), 


как показано в табл. 3.16. 

Безусловные средние арифметические значения определим, вы- 
числяя ту и ту, по способу произведений через безусловные эм- 
пирические вероятности (табл. 3.15): 


12 
mi = УвИр = 0,643, 


my = Ур =-0,243 


Проверка другим способом по формулам (3.326) и (3.336) показы- 
вает, что вычисления правильны. Тогда по формулам (3.32а) и 
(3.33а) 

M[X] = 90+ 15.0,643 = 99,6 (мм) 

МУ] = 6,8 — 0,7 - 0,243 = 6,6 (мм). 


Безусловные дисперсии определим по формулам (3.35), исполь- 
зуя суммы квадратов отклонений, приведенные в последнем столб- 
це и предпоследней строке табл. 3.15: 


D’[X] = 10,691 - 0,643? = 10,278, 
D[X] = 15? - 10, 278 = 2312,55, 
откуда o[X] = 48, 1; 
D'[Y] = 6, 851 — (—0, 243) = 6,792, 
D[Y] = 0,7? -6,792 = 3, 33, 
откуда o[Y] = 1,8. 


Таблица 3.16 


Частости кумулятивной призмограммы совместного распределения 
и кумулятивных гистограмм безусловных распределений к примеру 3.4 


а И на г 
15 | 30 | 45 | 60 | 75 “| 105 | 120 | 135 | 150 | 165 | 180 | РДУ <y;) 

uy a + 
3,3 0,005 | 0,010 | 0,015 0,015 
4,0 0,010 | 0,081 | 0,091 | 0,096 0,096 
4,7 0,104 | 0,194 | 0,232 | 0,251 | 0,260 0, 260 
5,4 0,203 | 0,283 | 0,321 | 0,353 | 0,358 0,358 
6,1 0,208 | 0,325 | 0,396 | 0,451 | 0,470 | 0,484 | 0,489 0, 489 
6,8 0,325 | 0,410 | 0,488 | 0,540 | 0,582 | 0,601 0,615 
7,8 0,330 | 0,424 | 0,516 | 0,577 | 0,619 | 0,657 0,704 
8,2 0,429 | 0,526 | 0,592 | 0,653 | 0,696 0,841 
8,9 0,658 | 0,706 0,930 
9,6 0,715 0,954 
10,3 0,981 
11,0 1,000 

РАХ <=) | 0,010 | 0,104 | 0, 208 | 0,330 | 0, 429 | 0,526 | 0,592 | 0,658 | 0,715 
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В последней строке табл. 3.15 приведены суммы ys xf yp, 


используя которые, по формуле (3.30) вычислим 
COV'[XY] = 7, 24 — 0,643 (—0, 243) = 7,396. 
Тогда коэффициент корреляции определится по формуле (3.29): 
7,396 


= 0,885, 


отсюда «линейная» оценка коэффициента детерминации: г? = 
0,783. По формулам (3.31) вычислим оценки коэффициентов ли- 
ний регрессии: 
_ 0,7-7, 396 
“vl? = 15.10,278 
_ 151,396 
“ely = 07-6, 792 
"Теперь займемся вычислением частостей условных распределе- 
ний, условных средних, линий регрессии и корреляционных отно- 
шений. Условные распределения У по X, заданные частостями 
ea, представлены в табл. 3.17. Условные распределения Х по У’, 
заданные частостями £4, представлены в табл. 3.18. В этих же 
таблицах приведены промежуточные величины, необходимые для 
расчета условных средних, дисперсий условных средних и оста- 
точных дисперсий. По формулам (3.34) и табл. 3.17 и 3.18 вычи- 
слены условные средние М (z/y;) иМ (y/z;), которые сопоставлены 
значениям у; и г; в табл. 3.19 и на рис. 3.13. 
Определим коэффициенты линии регрессии У по X графоана- 
литическим способом. При Х = 0 с графика (рис. 3.13) получаем 
by =3,1. Отсюда 


= 0,034, 


= 23,3. 


_ Ау _ 95-31 _ 
Фе = ZY = 0,035. 


Совпадение с ау/„, вычисленным через ковариацию, хорошее. Mo- 
жем принять уравнение у = 0, 0352 + 3, 1 в качестве оценки теоре- 
тической зависимости средних полупериодов от амплитуды коле- 
баний, 

Tak как точки M(z/y;) на рис. 3.13 не образуют «хорошей» пря- 
мой линии, коэффициенты линий регрессии Х по У вычислим по 
методу наименьших квадратов. Нормальные уравнения в явном 
виде следующие: 


1292 = 85,8az/y +126х, 
10650,4 = 683,54ae/y + 85,86х. 


Таблица 5.17 


Условные частости or значений у, при условии, что появились 


значения 2, и промежуточные величины к расчету 72, 


30 = 45 90 105 | 120 | 135 | 150 | 165 | 180 
| 

у, <4 Е] о 1 2 3 [4 5 6 

3,3 0,053 | 0,048 

4,0° 0,702 | 0,048 | 0,041 

4,7 -3 0,244 | 0,769 | 0,270 | 0,192 | 0,093 

5,4 -2 0,087 | 0,344 | 0,192 | 0,237 | 0,076 

6,1 —1 0,048 | 0,303 | 0,333 | 0,237 | 0,212 | 0,212 | 0,088 

6,8 о - 0,141 | 0,237 | 0,500 | 0,424 | 0,246 | 0,130 

7,5 1 0,041 | 0,091 | 0,144 | 0,136 | - | 0,333] 0,176 | 0,101 

8,2, 2 0,050 | 0,052 | 0,076 | 0,288 | 0,088 | 0,388 | 0,367 | 0,132 

8,9 3 0,076 | 0,088 | 0,130 | 0,367 | 0,368 

9,6 4 0,158 | 0,046 | 0,036 | 0,132 

10,3 5 0,083 | 0,065 | 0,237 

11,0 6 | 0, 046 | 0,065 | 

- 

321/22 =5 | —4,500 | —3,805 | —2,961 | 1,924 | 1,102 | —0,742 | -0,076 | 0,592 | 1,317 | 2,217 | 2,795 | 3,873 
id 20,250 | 14,478| 8,768] 3,702] 1,214] 0,551 | 0,006 | 0,350 | 1,734 | 4,915 | 7,812 | 15,000 
. 0,010 | 0,094 | 0,104| 0,122| 0,099 | 0,097 | 0,066 | 0,066 | 0,057 | 0,108 | 0,139 | 0,038 
Pi 0,202 | 1,361 | 0,912] 0,452] 0,120] 0,053] 0,000 | 0,023 | 0,099 | 0,531 | 1,086 | 0,570 


Таблица 3.18 
Условные частости 72 значений 2, при условии, что появились 


значения уу, и промежуточные величины к расчету т, 
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Puc. 3.13. Регрессии условных средних к примеру 3.4. 
По оси ордимат —значения полупериодов (у), по оси абецисе — 
значения амплитуды (2). Крестиками обозначены условные сред- 
ние M(y/z,), точками — условные средние M(x/y;) (см. табл.3.19). 
Сплошная линия — регрессия у = 0,0352 + 3,1. 


Приближенные вычисления дают такое решение системы —а: у = 
21; bx = —42, которое удовлетворительным образом соответствует 
вычисленному через ковариацию значению а,/у. Однако следует 
считать значение а,/у = 23,3 более точным* и заново определить 
bx: 


bx = аа — 85, 8. 23, 3) = —59. 


Таким образом, в качестве линейной оценки теоретической зави- 
симости амплитуды колебаний руки от полупериода принимается 
‘уравнение z = 23,3у — 59. 

Остается вычислить коэффициенты детерминации Х no У иУ по 
Х икорреляционные отношения. Сначала по формулам (3.36-3.37) 
и промежуточным величинам из табл. 3.15, 3.17-3.19 рассчитаем 


*Оно получено в результате более короткой цепочки вычислений. 


Таблица 3.19 


Условные средние арифметические значения 


'Регрессия У по Х | Регрессия Х по У 


M(u/zs) M(z/43) 
3,6 31 
4,1 32 
4,7 52 
5,4 п 
6,0 82 
6,3 m 
6,7 123 
7,2 145 
77 161 
8,4 154 
8,7 165 
9,5 11,0 165 


Примечание. Значения М(у/з.) округлены до десятых, а 
M(2/y;) — до целых в соответствии с точностью измерения полу- 
периодов и амплитуд. 


необходимые дисперсии: 
D’ {М (z/y,)] = 8,795 — 0,413 = 8,382, 
Di, [z/y;] = 10,691 — 8,795 = 1,896; 
D’ [М (y/zi)] = 5,409 — 0,059 = 5,350, 
Dé [y/zi] = 6, 851 — 5,409 = 1,442. 
Проверяя равенства. 
D'[X] = D’[M (=/%)] + Dy [z/yj] = 10,278 


РУ] = D’ [M (y/z1)] + 05 [4/24 = 6,792, 
убеждаемся в правильности вычислений. Окончательно находим 


8,382 1,896 
gi ce ara el i ean 2 Ч 

пе = 10,278 =\- 10,278 ~ (816, Mery 0,908; 
> _ 5,350 _ 1,442 - 
Теа = 1- в = 0,788 y= = 04888. 


Сопоставляя эти результаты с г? = 0,783, приходим к выводу, 
что корреляция в рассматриваемом случае почти не отличается 
от линейной. 


1.14, Расчет совокупных характеристик двумерной системы 
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Если эмпирические данные содержат одну-две значащие цифры, 
‘удобно рассчитывать векторы безусловных и условных средних, 
ковариационные и корреляционные матрицы, пользуясь матрич- 
ными уравнениями. Пусть, например, имеется двумерное рас- 
пределение частостей средних значений интервалов квантованных 
случайных величин XY, где X = (2, 4,7), У = (2, 3,5, 8): 


2 3 5 8 
0,01 0,03 0,05 0,11 

P(XY) = 4] 0,02 0,08 0,10 0,10}. 
7\007 0,09 0,15 0,19 


1. Вычисляем безусловные частные распределения, суммируя 
полное распределение «по другой» переменной: 


P(X) = У\Р(ХУ) = 
х 


= [(0,01 + 0,03 + 0,05 + 0,11), (0,02 + 0,08 + 0,10 + 0,10), 
(0,07 + 0,09 + 0,15 + 0,19)] = (0,2-2, 0,3-4, 0,57); 


PY) = > P(XY) = 
x 


= [(0,01 + 0,02 + 0,07), (0,03 + 0,08 + 0,09), (0,05 + 0,10 + 0,15), 
(0,11 + 0,10 + 0,19)] = (0,1 - 2, 0,2.3, 03-5, 04-8). 


2. Вычисляем компоненты вектора безусловных средних, сум- 
мируя полученные распределения «по своей» переменной: 


Мх =) _Р(Х) =02.2+0,3.4+05.7=51; 
x 
My = DOP(Y) =0,1-24+0,2-3+0,3-54+0,4-8= 5,5; 
У 
Мху = (Мх; Му) = (5,1; 5,5). 


3. Вычисляем элементы ковариационной матрицы. Сначала 
рассчитываем ковариацию по полному распределению, суммируя 
произведения совместных частостей на значения 2:у; и вычитая 


из суммы произведение безусловных средних: 


COVxy = 00 P(XY) - MxMy = 
ху 
=0,01.2.2+0,03.2.3+0,05.2.5+0,11.2.8+ 
+0,02.4.2+0,08.4-3+0,10.4.5+0,10.4.8+ 
+0,07-7-2+0,09-7-3+0,15-7-5+0,19-7-8— 
—5,1.5,5 = 27,56 — 28,05 = —0, 49. 


Залем по уравнениям (3.35) вычисляем безусловные дисперсии по 
частным распределениям, суммируя произведения безусловных 
частостей на квадраты значений и вычитая из суммы квадрат без- 
условного среднего: 


Dx =) P(X?) - МХ =0,2.22+0,3-42+0,5.7? —5,12 = 4,09; 
x 


Dy = > P(¥?)— м} = 
у 


=0,1.22+0,2.32+0,3.5?+0,4.8? —5,5? = 5,05. 


Тогда 
x У x зд 
Key eX (Dx COVar) _X (409 -0,49 
ХУ У \COVxy Dy У \-0,49 5,05 )° 


4. Вычисляем коэффициент корреляции и записываем корреля- 
ционную матрицу: 


гху = COVxy: /DxDy = -0,49 : /4,09 - 5,05 я —0,107 = —0,11; 


x за 


СХ [ 100 -0,11 
Tey (4% tin): 


5. Вычисляем матрицы условных распределений: 
Р(Х/У) = P(XY)8P(Y) = 


2 3 5 8 
2} [0,01 0,03 0,05 01 
=4 0,02 | :0,1; | 0,08 | :0,2; | 0,10] :0,3; | 0,10 | :0,4| = 
7! \oo7 0,09 0,15 0,19 
2 3 5 8 


2/01 | 0,15 | 017 ! 0,275 
| 0,40 } 0,33 | 0,250 |; 
7\07 | 0,45 | 0,50 | 0,475 


P(Y/X) = P(XY)8P(X) = 
2 3 5 8 
2 | (0,01 0,03 0,05 0,11) : 0,2 
=4 | (0,02 0,08 0,10 0,10) : 03] = 
7 [(0,0т 0,09 0,15 0,19) : 05 
2 3 5 8 
9,25 0,55 


0,33 0,33 


0,30 0,38 
Здесь по-прежнему условные распределения отделены друг от 
друга пунктиром. 
6. Вычисляем по полученным матрицам векторы условных сред- 
них: 
= Мх/у= = 0,1.2+0,2.4+0,7-7=5,9, 
Мх/у=з = 0,15.2+0,40.4+0,45.7=5,05, 
Мх/у=5 = 0,17.2+0,33-4+0,50.7=5, 16, 
Мх/у=в = 0,275.2+0,250.4+0,475-7 = 4, 875; 
Мхиу = (Мх/з; Мх/з; Мх/з; Mxys) = (5,9; 5,05; 5,16; 4,875); 
= 0,05.2+0,15.3+0,25-5+0,55.8 = 6,20, 
0,07.2+0,27.3+0,33.5+0,33-8 = 5,24, 
0,14-2+0,18-3+0,30.5+0,38.8 = 5, 36; 
Myx = (Муз; Му; Мул) = (6,20; 5,24; 5,36). 
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Проверяем: 
Mx =M[Mx;y] = 
=0,1.5,9+0,2.5,05+0,3.5,16+0,4-4, 875 = 5,1; 
Му=м [My;x] = 0,2.6,20+0,3-5,24+0,5-5,36 = 5,5 


— условные средние рассчитаны правильно. 
7. Вычисляем векторы условных дисперсий по матрицам услов- 
ных распределений: 


Dxyy=2 = 0,1-2? +0,2-4? +0, 1-7? — 5,9? =3,09, 

Пхуу=з = 0,15.22+0,40. 4? 4+ 0,45-7? — 5,05? = 3,55, 
Пхуу=ь = 0,17- 2? +0, 33 - 4? + 0,50- 7? — 5, 16? = 3, 84, 
Dx/y=e = 0, 275 - 2? + 0, 250 - 4? + 0,475 - 7? — 4,875? = 4,60; 

Зхуу = (3,09/y = 2, 3,55/y = 3, 3,84/y=5, 4,60/y = 8); 
Dyje=2 = 0,05 - 2? + 0,15 - 3? + 0, 25-5? +. 0,558 — 6,22 = 4,56, 
Dyjze=a = 0,07. 2? +0, 27 - 37 + 0,33 -5? + 0,33 -8? — 5, 24? = 4,62, 
0, 14-2? +0, 18. 3? + 0, 30-5? + 0, 38-8? — 5, 36? = 5, 27; 
(4,56/z = 2, 4,62/2 =4, 5,27/z=7). 


уу = 
Чу) х 
8. Вычисляем средние из условных дисперсий — так называемые 


остаточные, или случайные, дисперсии — по полученным векто- 
рам условных дисперсий: 


Do (y/zi] = 0,2.4,56+0,3-4,62+0,5-5,27 = 4,933; 
Do [2/yj] = 0,1.3,09+0,2.3,55+0,3.3,84+0,4.4,60 = 4,011. 


9. Вычисляем дисперсии условных средних — так называемые 
факторные дисперсии: 


р (Мхуу) = )> PryM%)y — МХ = 
У 


= 0,1: 5,9? + 0,2 .5,052 + 0,3 .5,16? + 0,4 - 4,875? — 5,1? = 0,065; 


р (Муух) = DY PxM},x -My= 
х 


= 0,2 6,20? + 0,3 5,24? + 0,5 - 5,36? — 5,52 == 0,041. 


Проверяем, сопоставляя с вычисленными раньше безусловными 
дисперсиями, по уравнениям (3.13): 


Dy =D [My;x] + Do [y/zi] = 0,041 + 4,933 = 4,974 


— против 5, 05, так что ошибка составляет около 1,5% от исходно- 
го результата; аналогично: Ох = 0,065 + 4,011 = 4,076 — против 
4,09, так что ошибка меньше 1%. Следовательно, результаты рас- 
чета остаточных и факторных дисперсий приемлемы. 

10. Вычисляем коэффициенты детерминации (3.14) и корреляци- 
онные отношения (3.15): 


тих = D [Му/х] : Dy =0,041: 5,05 = 0,0081, пуух #2 0,09; 
Пит = D[Mxyy] : Dx = 0,065: 4,09 = 0,0159, пхуу ^ 0,13. 
Теперь можно записать псевдокорреляционную матрицу: 
x ¥ 


Rec= X (100 0,13 
nm ¥ \0,09 1,00)” 
Сравнивая корреляционные отношения с полученным выше ко- 
эффициентом линейной корреляции гху = —0,11, можно видеть, 


что в данном случае ryy = 0,5 (ny + тих), т.е. нелинейности 


простых регрессий «Х по У» и «У по Х» небольшие и линейная 
аппроксимация вполне приемлема. Любознательный читатель мо- 
жет самостоятельно по векторам условных средних построить гра- 
фик, по формулам (3.21) или (3.22) вычислить угловые коэффици- 
енты регрессий и графоаналитическим способом найти свободные 
члены для уравнений этих регрессий. 


глава: КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 
{ |. МНОГОМЕРНЫЕ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН И ИХ ХАРАКТЕРИСТИКИ 


11|. Понятие о многомерной системе 


N случайных величин, рассматриваемых совместно, образуют 
М№-мерную систему случайных величин. При N > 2 обычно гово- 
PAT о многомерных системах. 

Пусть случайные величины X;, Хз, Хз, ..., Хы... Хм АМ 
(i = 1,2,...,N) образуют систему. Тогда в каждом испытании 
совместно реализуются (или рассматриваются) № значений: г1, 
123,....2)....ЕМ-и м, каждое из области определения соответ- 
ствующей случайной величины Х;. Такую совокупность из № зна- 
чений =; можно рассматривать как координаты реализации слу- 
чайной точки А в №-мерном декартовом пространстве, Если со- 
единить точку А с началом координат, то совокупность значений 


2: (i= 1,2,...,N) может рассматривалься как совокупность коор- 
динат проекций реализации случайного вехтора OA на координат- 
ные оси. 


Таким образом, №-мерная система случайных величин интер- 
претируется как случайная точка в гиперпространстве* либо как 
случайный №-мерный вектор и задается списком своих реализа- 
ций**, каждая из которых определена совокупностью из М проек- 
ЦИЙ 21,22,....2м на координатные оси. Пример реализации слу- 
чайной точки и случайного вектора в геометрической интерпрета- 
ции для трехмерной системы дан на рис. 4.1. Заметим, что рассмо- 
тренные в предыдущей главе двумерные системы — простейший 


*Гиперпространством называется №-мерное пространство при № > 3. Ги- 
перпространство мельзя изобразить в наглядной геометрической форме. По- 
этому многомерные системы изображаются в аналитической или табличной 
форме. 

*“Ревлизация случайной точки (случайного вектора) —ето точка (век- 
тор), полученная в результате опыта при некотором комплексе существен- 
‘ных условий. 
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Puc. 4.1. Геометрическая интерпретация трехмерной системы 
Случьйные величины X;,X2,X3 изображены осями прямо- 
угольной системы координат. А— реализация случайной точ- 
ки; А;2 — проекция А ma плоскость X;OX2, аналогично Ais 
и Ags — проекции А ма соответствующие плоскости ХзОХз и 
Х.ОХ,. «Тройка» значений (21, 22, 23) однозначно определяет 
положение точки А в трехмерном пространстве. ОА — реали- 
зация случайного векторь; ОА:2, ОАзз и ОАзз — проекции OA 
на соответствующие плоскости. Так как направление и вели- 
чина вектора ОА однозначно определены положением точки 


А, то ее координаты суть и координаты вектора ОА 


случай многомерных систем (при № = 2) — интерпретировались 
нами в виде случайной точки на плоскости («поле корреляции» 
на рис. 3.11) и задавались списком из п пар значений г, у. 


4.1.1, Разновидности многомерных систем 


Среди всевозможных многомерных систем для психологических 
приложений важно выделить: 1) системы однородные и разнород- 
ные; 2) неслучайные и случайные функции случайных величин. 

Однородные (гомогенные) системы образованы однородными 
случайными величинами. В любой отрасли психологии, осуще- 
ствляя совместный анализ наличия или степени выраженности 
какой-либо психической переменной Х у группы из № индивидов, 
п-кратно измеряют у каждого индивида проявление этой перемен- 
ной. Тогда, если обозначить психическую переменную 1-го ин- 
дивида как X;, получаем №-мерную однородную систему, которая 
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задана списком из N-n значений х;; (i= 1,2,..., Nj = 2, -..,т): 
Zi, 212, - sory м, 
221, 222, - 12м, 


Fir, 1}2, .... Фи, ..., М, 


Tt, 201, --.) Fn › Tnn- 


Неоднородные (гетерогенные) системы образованы случайными 
величинами, природа которых различна. Они имеют место при со- 
вместном изучении разных психических явлений как у отдельных 
индивидов, так и у популяции. Например, совокупность гипоте- 
тических черт личности представляет собой в указанном смысле 
гетерогенную систему случайных величин. 

Разделение многомерных систем на однородные и неоднород- 
ные важно по двум обстоятельствам. Во-первых, для однородных 
систем имеют очевидный физический смысл операции суммирова- 
ния отдельных величин, входящих в систему, тогда как для неод- 
нородных систем эти операции очевидного смысла не имеют*. В 
этой связи при создании и интерпретации многомерных психомет- 
рических шкал возникают известные трудности, преодолеваемые 
отчасти специальными приемами вроде нормализации по составу, 
рассмотренной выше, с отображением всех разнородных перемен- 
ных в некоторую однородную, так что в результате неоднородная 
система отображается в эквивалентную однородную систему*»* 
Во-вторых, для однородных систем хорошо разработаны основы 
и приложения выборочного метода, тогда как для неоднородных 
систем выборочный метод развит недостаточно (см. главу 5). 

Как и двумерные, многомерные системы могут быть образова- 
ны независимыми и зависимыми случайными величинами. Если 
отдельные случайные величины в многомерной системе зависят 
друг от друга (попарно и/или в совокупности), то рассмотрению 
подлежат неслучайные и случайные функции. 

Неслучайные функции от случайных величин (случайных аргу- 
ментов) называются множественными регрессиями (корреляцион- 
ными уравнениями). Парные регрессии, рассмотренные выше, — 
это частный случай множественных регрессий. Наиболее распро- 
странены суммы и произведения случайных величин, а также их 


*Нельзя непосредственно складывать мужской пол и уровень интеллек- 
тувльного развития. 
'Например, 11 разнородных психических переменных Х; в шкале Векс- 
лера (тип WAIS) отобрьжаются в 11 однородных переменных У;, каждая из 
которых есть сумма баллов за выполнение i-ro субтеста. 


комбинации. Регрессии независимо от вида— это всегда детер- 
минированные функции случайных аргументов (т.е. способ связи 
задан однозначно), поэтому их и называют неслучайными функ- 
HAMM от случайных величин. 

Случайные функции (в отличие от неслучайных) —это случай- 
ные способы связи случайных (или неслучайных) переменных*. 
Случайной называется функция, которая в конкретном испытании 
принимает значение из множества возможных функций, заранее не 
известно, какое. 

Для пояснения здесь уместно провести аналогию с определе- 
ниями случайного события и случайной величины. Случайное 
событие в опыте принимает значение из множества исходов (не- 
пересекающихся классов). Случайная величина принимает апо- 
стериори значение из множества числовых значений (из области 
определения). Случайная функция в результате опыта реализу- 
ется в виде неслучайной функции из некоторого класса функций, 
причем априорное множество непересекающихся классов функций 
можно рассматривать как область определения случайной функ- 
ции. 

Рассмотрим один из распространенных способов задания слу- 
чайной функции в виде системы случайных величин. Пусть слу- 
чайная функция f(X) реализуется в п испытаниях, как показано 
на рис. 4.2, в виде п реализаций f;(X), где j = 1,2,...,n. Тогда 
для каждого 1-го значения аргумента X;(i = 1,2,..., №) имеем слу- 
чайную величину /;(Х+), заданную совокупностью значений слу- 
чайной функции, соответствующих значению аргумента X;. Рас- 
сматривая совместно М значений аргумента, получаем систему из 
№ случайных величин: 


Sj(X1), F(X), - G(X) H(Xw), 


каждая из которых принимает свои значения fj(X;) в 7-м испы- 
тании. Можно видеть, что определенная таким путем случайная 
функция одного аргумента интерпретируется в виде однородной 
системы случайных величин. Неоднородная система должна рас- 
сматриваться как случайная функция № неоднородных аргумен- 
тов. В общем виде изобразить такую функцию невозможно, так как 
ее реализации — это гиперповерхности, поэтому отметим лишь не- 
которые абстрактные представления такой функции. 

Случайная функция произвольного, но конечного числа разно- 
родных аргументов, очевидно, может рассматриваться как сово- 


«Отметим, что в теории случайных функций неслучайные функции слу- 
чайных аргументов рассматривают как разновидность случайных функ- 
ций. При етом, однако, имеют в виду второй смысл термина «функция» — 
зависимую переменную, которая всегда случайна, если случаен аргумент. 


и] 
00) 90 Hd 


X% Xp Xs Xw 

Puc. 4.2, Представление случайной функции в виде системы слу- 
чайных величин. 
Х; — вргумент, задвиный лискретными значениями (i= 1,2, ...,М); 
1 (Х) — значения случайной функции; /,(Х) — реализация случай- 
ной функции. Случайные величины образуются точками пере- 
<ечения ревлизаций с перпендикуляром, восстановленным из Ху; 
(Хх) — значение М-й случайной величины. 


купность однородных систем случайных величин (по одной систе- 
ме для каждого аргумента, как на рис. 4.2), Такая совокупность 
есть система случайных функций и, следовательно, метасистема, 
случайных величин. 

К понятию метасистемы можно прийти и от понятия неоднород- 
ной многомерной системы. Действительно, неоднородную систе- 
му всегда можно представить как систему однородных систем. С 
другой стороны, любая совокупность неоднородных систем, рас- 
сматриваемых вместе, образует метасистему. Специалистам — 
психологам, педагогам, социологам, врачам и т.п. нетрудно по- 
HAT, что совокупность психических свойств, состояний, а тем бо- 
лее функций, изучаемая на множестве индивидов, образует мета- 
систему в рассмотренном смысле. 


1}. Распределения в многомерной системе 


В многомерных системах существует большое разнообразие 
распределений. Полностью №-мерную систему в качественном и 
количественном отношениях характеризует №-мерное совмещен- 
ное распределение вероятностей. Для него традиционно рассма- 


тривают интегральную функцию и функцию плотности вероятно- 
стей. 
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Функция (интегральная) №-мерного совмещенного распределе- 
ния определяется вероятностями совместного выполнения нера- 
венств 


F(2i22...2w) = РКХ: < 21)(Xo < 22)...(Xw < zy). 


Плотность М№-мерного распределения (М№-мерная плотность) 
выражает те доли совместных вероятностей, которые приходятся 
на произведения интервалов квантования случайных компонентов 
системы: 


тля... 2м) = Рь.ш: Му Ак >. ANw, 


где ] = 1,2,...,m1,4 =1,2,...,n2,w =1,2,..., пм — индексы интер- 
валов квантования либо градаций отдельных величин в системе; 
Pyrw = Pl(ziy < Xi <=; + №; (гл = X2 = 24 + Аж)... (ми < 
Хм < 2мь + Амь)]. Лля дискретной многомерной случайной вели- 
чины Рук... .ш = P[(X, = 21j)(X2 = 224)...(Xv = нь) и понятие 
плотности не применяется. 

Лля психологической теории и практики наиболее важны N- 
мерные совместные вероятности Р;уь_„, которые в совокупности 
образуют дифференциальную функцию М-мерного совмещенного 
распределения. Эта функция может быть получена эмпирическим 
путем и определяет остальные распределения в системе. 

Полное №М-мерное распределение частот результатов измерений 
или подсчета можно определить следующим образом: 


F (Ам) = F(XiX2...Xw) = {jew}, (4.1) 


где индексы градаций или интервалов квантования отдельных ве- 
личин по-прежнему изменяются от 1 до п; ({— номер величины). 


м 
Всего поэтому имеется L = [] п; совмещенных градаций. Очевид- 


но, что общее количество наблюдений (измерений) определяется 
суммой частот по всем переменным: 
па п nw 


п=) 5. ль. (4.2) 


ЭВ wal 

Дифференциальная функция №-мерного совмещенного распре- 
деления вероятностей (частостей) 

P (Хм) = P(X X2...Xw) = {Рь.ш} (4.3) 


практически определяется из полного распределения частот (4.1), 
которое нормируется к единице общим количеством наблюдений 
(4.2): 

Р (Ам) = F(X) in = {Ль.ь in}. 


Частные, М — К-мерные, распределения в №-мерной системе 
случайных величин аналогично распределениям событий можно 
классифицировать на безусловные — совместные и изолированные, 
и условные — совместно-условные, условно-совместные, совмест- 
но-совместно-условные и условные изолированные. 

Частное совместное N— К-мерное распределение вероятностей 
определяется из полного суммированием по исключаемым величи- 


нам; например, 
P(Ax-K)= > OP xn), (4.4) 


Х Xo. Xe 


где К =1,2,...,N—1. Очевидно, что при К = М-1, т.е. при сум- 
мировании совместных вероятностей по всем остальным, кроме 
одной, случайным величинам, определяются изолированные (од- 
номерные) распределения компонентов системы. 

Совместно-условные—это N — К-мерные совместные распре- 
деления, которые определены при условии конкретных значений 
одной из А величин в системе; например, 


P(X, X2/233), P(X Хз Хз/ тар) ит.д. 


Для всех выделенных градаций случайного условия такие распре- 
деления записываются в виде матриц совместно-условных распре- 
делений: 

P(X X2/X3) = [P(X1X2/z31),P(X1X2/z32),-..,P(X1X2/z4m)]- 

Условно-совместными можно назвать распределения одной из 
величин, определяемые при условии совмещения каких-либо кон- 
кретных значений из N — А остальных величин в системе; напри- 
мер, 

Р(Х, /зугзь), Р(Х1/тзутзьта!) ит.д. 

Эти распределения также ассоциируются в матрицы условио- 
совместных распределений: 


P(X1/X2X3),P(Xi/X2X3X4) ит.д. 


Совместно-совместно-условные распределения имеют место, 
как это подчеркнуто названием, при совмещении значений одной 
части компонентов системы и при условии совмещения значений 
другой части компонентов; например, 


Р(Х! Хз /тзутльты), Р(ХзХаХь/т1аг2.) ит.д. 
Из этих распределений тоже ассоциируются соответствующие ма- 
трицы. 
Наконец, условные изолированные распределения аналогичны 
рассмотренным в предыдущей главе: они определяются обычными 
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условными вероятностями значений одной из величин при условии 
конкретных значений другой какой-либо изолированной величины 
и ассоциируются в матрицы условных распределений вида (3.5). 
Различные частные распределения связаны между собой и с 
полным распределением матричными уравнениями, которые ана- 
логичны рассмотренным для случайных событий (1.24) и двумер- 
ных случайных величин (3.8 и 3.9), но гораздо более разнообразны. 


В частности, полное М-мерное распределение можно представить 
так: 


Р(ХаХ,...Хн) = 
= Р(Х!) 0 P(X2/X1) < Р(ХЬ/ Х Ха) о Р(Хн/Х,Хь ...Хн1) 
P(X Xs) (4.5) 


Р(Х, Х2Хз) ит.д. 


Матрицы условных распределений получаются с помощью обрат- 
ной (4.5) операции: 


Р(Х»Хз...Хк/Х!) = P(XiX2...Xw) 8 P(X), 
P(XaXa...Xw/XrX2) = P(X1Xp...Xw) 0 P(X1 Xa), 


P( 


/ХиХз...Хм-1) = P(XiX2... Xn) 8 Р(Х Ха...Хм-1). 


Условиями независимости случайных компонентов М№-мерной 
системы по-прежнему служат равенства безусловных и «одно- 
именных» условных распределений: 


P(X1) =Р(Х!/1;)) = ... = Р(Х/таутзь...тМь), 
Р(Х2) = Р(Х?/ 11а) = ... = P(X2/Z1arae-.-2Nw)s 


Р(Хм/тлат?} -..2N-1,v): 


Аналогичные равенства можно было бы написать для частных со- 
вместных безусловных и условных распределений, но они излиш- 
ни, так как (4.6) суть достаточные условия стохастической неза- 
висимости. Естественно, что для независимых компонентов урав- 
нение (4.5) существенно упрощается: 


P(X, Xo... Xu) = P(X1) ® P(X2) ®.--®Р(Хн). (4.7) 


Этим можно пользоваться для планирования эксперимента либо 
при отсутствии данных для эмпирического получения многомер- 
ных совмещенных распределений. Но следует помнить, что апри- 
орное допущение независимости компонентов многомерной слу- 
чайной величины может сильно исказить образ реальности. 


Многомерные распределения необходимо эмпирически полу- 
чать и изучать для многих целей психологической науки и прак- 
тики. Однако это весьма трудоемкая научно-исследовательская 
работа. Поэтому часто ограничиваются числовыми характери- 
стиками. 


4.1.4, Числовые характеристики в многомерной системе 


Числовыми характеристиками распределения в многомерной 
системе являются меры положения, рассеивания и связи. 

В качестве мер положения используются средние арифметиче- 
ские значения, безусловные и условные. Безусловные средние— 
М:,М2,...,Мм— можно рассматривать как координаты «центра 
тяжести» М№-мерной системы. Условные средние локализуют в N- 
мерном пространстве «центры тяжести» К-мерных подсистем. 

В качестве мер рассеивания используются безусловныеи услов- 
ные дисперсии, а также стандартные отклонения. 

В качестве мер связи наряду с уже рассмотренными мерами 
линейной и нелинейной парной корреляции используются меры 
парциальной (частной, групповой) и множественной корреляции. 

Из перечисленных мер новизну представляют лишь меры свя- 
зи, которые мы здесь и рассмотрим. В Х-мерной системе, как 
указывалось, можно рассматривать любую часть K < М величин 
в связи с остальными № — К. Поэтому с точки зрения числа свя- 
занных между собой переменных выделяют связь частную (груп- 
повую, парциальную) и множественную. И та и другая могут, 
вообще говоря, быть линейными или нелинейными по форме, вза- 
имными или односторонними по направленности. 

Любая связь характеризуется мерами частной и множествен- 
ной детерминации, но линейная взаимная связь — мерами частной 
и множественной корреляции. Принято говорить о степени (по- 
рядке) частной связи, которая в простейшем случае парной свя- 
зи называется «нулевой». В качестве мер частной детерминации 
нулевого порядка используются уже рассмотренные My;, а в ка- 
честве мер частной корреляции нулевого порядка — ковариации и 
коэффициенты линейной корреляции Пирсона (хз), вычисленные 
для всех сочетаний по два из № переменных (парные). 

Сравнительная простота вычислений обусловливает преимуще- 
ственное использование в психологических исследованиях именно 
ковариаций и парных коэффициентов линейной корреляции, хотя 
вто может быть по существу и не обосновано*. Совокупности пар- 


Отметим, что в частном случае М-мерного нормального распределения 
линейные меры исчерпывающе херьктеризуют взаимосвязи. 
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ных ковариаций и коэффициентов корреляции объединяются в ма- 
трицы, которые и характеризуют частные взаимосвязи нулевого 
порядка в №-мерной системе. 

Ковариационная матрица порядка N образуется значениями ко- 
вариаций и безусловных дисперсий, как показано в табл. 4.1. Не- 
трудно видеть, что ковариационная матрица симметрична отно- 
сительно главной диагонали, поэтому из общего числа N(N — 1) 
ковариаций только 0,5N(N — 1) различных. 


Тоблица 4.1 
Ковариационная матрица М-мерной системы случайных величин 
Хх: Хх: | es 


x Dy COVi2 
X2 | COVi2 D2 


х; | соуь | COV: 


Хы | COViw | COVay 


Примечание. СОУ ; = О, Так как COV,, = COV,,, то поря- 
док индексации одинаков во всей матрице. 


Корреляционная матрица образуется путем нормирования кова- 
риационной матрицы парными произведениями стандартных от- 
клонений. В результате по главной диагонали располагаются еди- 
ницы, а остальные элементы — коэффициенты линейной корреля- 
ции Пирсона (табл. 4.2): 


_ COVi; 
rj = 
где СОУ:;; — ковариация 1-й и ]-й переменных, о; и 9; — безуслов- 
ные стандартные отклонения*. 
Таблица 4.2 
Корреляционная матрица №-мерной системы случайных величин 
Xn 
пм 
там 


*Корреляционная матрица в психологических исследованиях иногда име- 
нуется таблицей интеркорреляций. 


Корреляционная матрица в прикладных исследованиях обычно 
интерпретируется геометрически либо в виде графа (в корреляци- 
онном анализе), либо в виде конфигурации векторов (в факторном 
анализе, см. главу 7). 

Корреляционным графом назовем совокупность из М вершин, 
обозначающих переменные и соединенных попарно линиями (ре- 
брами), обозначающими факт корреляции между парами перемен- 
ных ij (i = 1,2,...,Njj = 1,2,...,М, но i # 7). Так, для трех 
случайных величин корреляционный граф изображен на рис. 4.3. 
Сверху (или снизу) ребра надписывается значение гу. Разновид- 
ностью корреляционных графов являются корреляционные плея- 
ды*, в которых длина ребер выбирается пропорциональной +, 
положительная связь отображается сплошной, а отрицательная — 
пунктирной линией. Имеются и другие способы изображения 
ту на ребрах корреляционного графа. Здесь необходимо отме- 
тить, что коэффициент корреляции г;; отображает лишь факт со- 
вместной изменчивости #-Й и ]-й переменных. Это значит, что 
при | гу; |> 0 либо сами переменные ij находятся в причинно- 
следственной взаимной связи, либо они причинно обусловлены 
некоторой другой переменной, входящей или не входящей в рас- 
сматриваемую систему. Следовательно, ребра корреляционного 
графа можно лишь гипотетически трактовать в содержательном, 
а не в формальном смысле. 


Puc. 4.3. Корреляционный граф к примеру 4.1. 
Вершины обозначают: {— социометричес- 
кий статус в группе; 2 — нейротизм; 9— вмо- 
пиональную экспансивиость. Ребра обозиа- 
чают коррелиционную взвимосвизь (значе- 
нил парных коэффициентов корреляции — из 
табл. 4.7), 


Коэффициенты линейной частной корреляции первого порядка 
вычисляются через коэффициенты нулевого порядка и характе- 
ризуют взаимосвязь между парами переменных при условии, что 
третья переменная приняла фиксированное значение: 

rye = АТИ , (4.8) 
Vil= rid rf) 


где rij~—Koappuunent частной корреляции первого порядка, 


“Терентьев П.В. Метод корреляционных пленд// Вести. Ленингр. 
ун-та. 1959. №9. 
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характеризующий линейную взаимосвязь 1-Й и /-Й случайных ве- 
личин, при элиминировании влияния &-й величины (индекс эли- 
минируемой переменной отделяется точкой); ту, Pik, тук — коэффи- 
циенты нулевого порядка; i # j # Е— номера переменных в си- 
стеме, принимающие значения от 1 до №. Вообще коэффициенты 
частной корреляции A-ro порядка вычисляются по формулам, ана- 
логичным (4.8), через коэффициенты частной корреляции h — 1-го 
порядка. Например, 


712.34..(N-1) — TIN 34... (М-1) * Г2М.34..(М-П) 


у 


Универсальной мерой тесноты множественной связи является 
хозффициент множественной детерминации случайной величины 
X; остальными М — | случайными величинами многомерной систе- 


мы: 
лы 
#.23...№ DIX] = 


712.34..N = (4.9) 


TN. cn-y)Q —Tiy sa w-1)) 


Do 

D(X)’ 
где Dp — доля дисперсии D[X;], обусловленная изменениями услов- 
ного среднего арифметического значения M[X;] под влиянием 
остальных № — 1 переменных; Оо — доля дисперсии О[Х:], обусло- 
вленная неучитываемыми в исследовании факторами. 

Остаточную дисперсию вычислять проще, чем факторную. 
Остаточная дисперсия для линейной корреляции может быть вы- 
‘ражена следующим образом: 


Do = О; 23. м = 01 - 145) (1 - газ) --.(1- м аз.цм-0) (41) 


где 0:23. м -— остаточная дисперсия {-Й случайной переменной, 
рассматриваемой в зависимости от остальных NV — | величин; Dj — 
безусловная дисперсия iH величины; г/т». 7 (м) — 
квадраты коэффициентов частной корреляции возрастающего по- 
рядка. 

Подставляя (4.11) в (4.10) и обозначая R25, y коэффициент ли- 
нейной детерминации, получим 


2.3. м =1- (1-"2)( "45 3)...@ - 2.23. 4-1) (4.12) 


Величина В+2з.м = УВ? зн называется коэффициентом множе- 
ственной корреляции, который и характеризует степень линейной 
взаимосвязи {-Й случайной величины с остальными N — | вели- 
чинами в системе. Величины Вх 23. м зависят от степени тесноты 
взаимосвязи, от количества переменных в системе и от степени 
близости анализируемых связей к линейным. В этой связи важно 
подчеркнуть, что, во-первых, всегда 


(4.10) 


В: 23. м > rij, 


где rij — наибольший из парных коэффициентов корреляции, a во. 
вторых, низкая величина R; 23 м может свидетельствовать лишь 
об отсутствии линейной связи. Остаточную дисперсию и Связан- 
ные с ней меры 1255 м и В} хм можно определить и другими 
способами, которые будут рассмотрены ниже. 

По аналогии с двумерной системой можно ввести понятие ко- 
эффициента множественной индетерминации 


=? 
№. м=1- Вам, 


который служит мерой необусловленности 4-й случайной перемен- 
ной в системе остальными N — 1 переменными и, следовательно, 
может характеризовать изменчивость :-й переменной как обусло- 
вленную неконтролируемыми факторами (не включенными в си- 
стему). Очевидно, что мерой множественной акорреляции может. 
служить коэффициент 


Ва. м = 1-82, м. (4.13) 


Меры множественной корреляции, рассматриваемые традици- 
онно, в сущности не характеризуют М-мерную систему в целом. 
Фактически М-мерная система расчленяется на N таких подси- 
стем, в каждой из которых 1-я случайная переменная рассматри- 
вается как зависящая от N — ] остальных случайных аргументов 
(см. $4.2). Такие подсистемы по отдельности и характеризуются 
мерами множественной связи, Таким образом, №-мерная система, 
с точки зрения наличия в ней отдельных множественных связей 
характеризуется совокупностью в № мер. Однако возникает пра- 
вомерный вопрос о том, нельзя ли иметь одну меру, характеризую- 
щую М-мерную систему в целом с точки зрения ее стохастической. 
связности. 

Согласно общему определению стохастической независимости 
M зависимости величин, образующих №-мерную систему (4.7) и 
(4.6), можно рассматривать стохастическую связность системы 
как степень отличия всех вероятностей Py, фактически наблю- 
даемых, от вероятностей РА т’ Теоретически ожидаемых в пред- 
положении о независимости величин (4.7). Тогда в качестве меры 
стохастической связности системы можно использовать коэффи- 
циент сопряженности Чупрова (1.32), видоизменяя его следующим 
образом: 


у pnw, ый 

=1 wi °*” =1 

С пы 5. (414) 
+79 
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rae Км — коэффициент связности №М-мерной системы; в числите- 


де под радикалом записана величина отношения Хх? к числу на- 
2 


блюдений: ЕЕ, определенному после группировки 
‘данных; L — общее число пересечений интервалов квантования пе- 
ременных (nj -n2-...-ny); Е и 9— соответственно число строк и 
столбцов в группировочной таблице (см., напр., табл. 4.4), так что 
t-g = Г. Лля конкретной системы, заданной в табличной форме, { и 
3 можно определить численно, и тогда формула (4.14) упрощается: 


Е м ieee Pa 
а RA 

98-5 
тдег= 1,2,....{— номера строк и k = 1,2,...,9— номера столб- 
цов группировочной таблицы, присваиваемые вне всякой связи со 
значениями уровней квантования переменных. 

Величина К?, может быть названа коэффициентом совместной 
детерминации, в отличие от коэффициентов множественной детер- 
минации вида 72.3 м. Поскольку стохастическая связь не исчер- 
пывается корреляцией, всегда справедливо 


(4.15) 


25:2 

KN 21:23. м, 
где 1?.з_м-— наибольший из всех коэффициентов множественной 
детерминации. 


11, НЕСЛУЧАЙНЫЕ ФУНКЦИИ ОТ СЛУЧАЙНЫХ АРГУМЕНТОВ 


4.1.1, Числовые характеристики суммы и произведения случайных величин 


В общем виде неслучайная функция от М случайных аргументов 
записывается так: 


У = 9(X1,X2,.-.. Xn), 


где р — некоторая линейная или нелинейная функция, чаще всего 
это простая сумма 


м 
У=У.Хь (4.16а) 


или (линейное) уравнение гиперплоскости 


N 
¥ =o aX; +, (4.166) 


+= 


или нелинейное уравнение гиперповерхности, в которое аргумен- 
тами входят еще произведения случайных величин по два, по три, 
по М, а иногда и степени отдельных величин. Однако так как вто- 
рые и тем более высшие степени трудно истолковываль, а число 
произведений переменных быстро увеличивается при увеличении 
М, то стремятся использовать суммы (4.16a) и (4.166). 

Среднее арифметическое суммы случайных величин Х!, Х»,..., 
Xy равно сумме средних арифметических от слагаемых: 


м N . 
M [E=] = DMX], (4.17) 
1 i=l 
rae i= 1,2,..., М — номера слагаемых. 

`Лисперсия суммы случайных величин равна сумме всех элемен- 
тов ковариационной матрицы: 


м мм 
55: | =>: covy, (4.18) 


i=1 i= j= 


где СОУ;; —парные ковариации, i = 1,2,...,N,j = 1,2,...,М. 
Так как СОУ;; О; и для независимых случайных величин все 
СОУ:; = 0 при ] # i, то в частном случае независимых слагаемых 


имеем 
N N 

D [Ex] =)oDIxi). (4.19) 
#=1 isl 


Если величины X;,X2,...,Xy, образующие метасистему, сами 
являются суммами некоторых величин, то суммирование диспер- 
сий сводится к суммированию ковариационных матриц. При этом 
для независимых X),Xz,...,Xy ковариационная матрица суммы 
равна сумме ковариационных матриц слагаемых. 

Для независимых случайных величин среднее арифметическое 
произведения N случайных величин равно произведению средних 
арифметических от слагаемых: 


N N 
M ve = MU, (4.20) 
j=l 


ist 


в частном случае 
M [aX] = ам(Х], (4.21) 


где а— константа. 


Для центрированных величин*, независимых в совокупности, 
‘дисперсия произведения равна произведению дисперсий сомножи- 


телей: Ny P 5 
D [4 Про [x к 
= 
где x — центрированные величины. В частном случае 
р м =D [5] ‚ 
оо go 
D ел» =AxdAyD [x] . 


чем мы пользовались в прелыдущей главе при определении число- 
вых характеристик двумерной системы, 


а также 
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4.1.1. Законы распределения линейной функции от случайных аргументов 


Простая сумма вида (4.16a) распределений независимых слу- 
чайных аргументов называется композицией (сверткой). Компо- 
зиция легко определяется не для любых, a лишь для устойчивых 
законов распределения — закона Лапласа — Гаусса и гамма-рас- 
пределения**. 

Для нормального закона справедливо: если 


С 2 
ух = fe) = zlggew {ES ql } 


то 


РИКИ _ ме] 
м 5 ЛЕТУ 2D 


На композиции нормального закона основаны многие психометри- 
ческие шкалы. В частности, в шкале Векслера для взрослых сум- 
ма шкальных оценок субтеста — это композиция нормализованных 
предварительных оценок, а сумма шкальных оценок по группе вер” 
бальных (или невербальных) тестов — это композиция нормально 
распределенных шкальных оценок субтестов. 


"Случайная величина называется центрированной, если задань централь- 
ными отклонениями: 2: — Mz). 

"Композиция гамма-распределенных случайных величии тоже имеет 
гамма- распределение. 


‚Для гамма-распределения аналогично справедливо: если 


м 
тн Mt) = Со), 


= 
то 


ДТ) = та)” ‘®Ф(С-РТ), 


где 


1 x r 
sa Dies 0) [Emco] | 


Я 


1 N 
= M(t). 
т ae 


Очевидно, что для экспоненциального распределения как частно- 
го случая гамма- распределения при а = 1 мы можем записать: 


ДТ) = Вехр(-ВТ), 


где В определено уравнением (4.22). Композиция гамма-распре- 
деления позволяет оценивать распределение затрат времени на 
какие-либо действия, расчленяемые на последовательно выполня- 
емые простые операции. 

Закон распределения линейной функции вида (4.166) от нор- 
мально распределенных зависимых случайных аргументов имеет 
основное применение для многомерных психометрических шкал. 
Пусть X1, Хз, ..., Хм — случайные величины с плотностями 


(4.22) 


и пусть 


Тогда 


11 
f(y) = a¥] vas? 


где 


Отредактировал и опубликовал на сайте : 


СО\;; для всех i, включая i ‚ — элементы ковариационной Ma- 
трицы слагаемых; о[У] = DIY]. По формуле (4.23) оценивают- 
ся, в частности, спортивные достижения в международных пер” 
венствах. 

Частным случаем (4.23) является закон нормального распреде- 
ления суммы вида 


м 
Y=ay Xt, 
isl 


плотность которой 


ЛУ = wiv? 
где 


Diy] 


anapcexinj, Такому распределению соответствуют оценки обще- 
го, вербального и невербального интеллекта в упомянутой шкале 
Векслера для взрослых. Например, общий коэффициент интеллек- 
туального развития взрослых 


N 
1% = 0,6) Xi +6, 
isl 


где Х; — шкальная оценка за выполнение одного из N субтестов 
шкалы; $ — свободный член, параболически зависящий от возра- 
ста человека. 

Во многих практических случаях, лишь предполагая нормаль- 
ную распределенность аргументов, пользуются не самим распре- 
делением линейной функции N аргументов, а его моментами — 
средними арифметическими, дисперсиями, ковариациями и ко- 
эффициентами корреляции, взаимосвязанными в так называемом 
корреляционном уравнении (регрессии). 


1.1}. Множественные линейные регрессии 


Как и для двух случайных величин, в М№-мерной системе функ- 
ция, связывающая любые К случайных величин (К = 2,3, Му 
называется регрессией. Принято выделять простую, частную, 
чистую и множественную регрессии. Простая (парная) регрес- 
сия связывает условные средние арифметические значения 1-Й 
случайной величины со значениями -й случайной величины при 


всех наблюдавшихся значениях остальных М№ — 2 случайных вели- 
чин в системе. Частная регрессия связывает условные средние 
арифметические значения 1-й случайной величины со значениями 
K(K = 2,3,...,N —1) других случайных величин при каких-то 
определенных (фиксированных) значениях остальных № — К cay- 
чайных величин. Чистая регрессия — это разновидность частной 
регрессии для условий, когда остальные М — К случайных аргу- 
ментов фиксированы на среднем уровне. Множественная регрес- 
сия связывает условные средние арифметические значения одной 
из случайных величин со значениями всех остальных М -— 1 случай- 
ных величин. Зная уравнение множественной регрессии, можно из 
него получить уравнение чистой регрессии. Именно эти разновид- 
ности чаще всего и используются в психологической практике. 

По форме все перечисленные регрессии могут быть линейны- 
ми или нелинейными. Из-за сравнительной простоты математиче- 
ского аппарата наибольший практический интерес для психолога. 
представляют линейные регрессии*. В общем виде уравнение ли- 
нейной множественной регрессии {-Й переменной в развернутой 
форме записывается так: 


24.23..№ = @04.23..№ + 4:23. №22 + 
+432. мтз+ “+ амаа. мт, (4.24а) 


ГДе 2; 2з.. м — условное среднее значение случайной величины X;, 
соответствующее значениям 22, 2з,....2м, принимаемым осталь- 
ными случайными величинами; а42.3..№, @:3.2..№, @&М.23.._№-1 — коэф- 
фициенты регрессии, смысл которых рассмотрим несколько ни- 
же; а0.23...м — свободный член, показывающий, чему равен 2; 23. №, 
если все аргументы равны нулю. В сокращенной форме уравнение 
(4.24а) будем записывать так: 


N-1 
= DV царем. (4.246) 
Эн 


a 


Коэффициент регрессии ajj показывает парциальное (частное) 
влияние ]-го случайного аргумента на {-ю случайную величину, 
рассматриваемую в качестве зависимой переменной. При этом 
влияние остальных М — 2 случайных аргументов считается устра- 


уто, конечно, не означает, что нелинейные регрессии не должны приме- 
ниться. Bo многих случаях, когда требуется выявить точный теоретический 
закон, именно нелинейные регрессии могут оказаться единственно подходя- 
щими для математической формулировки искомого закона. Но в начале ис- 
следования обычно достаточны линейные приближения. Кроме того, можно, 
прийти к линейной регрессии, лииеаризуя переменные. 
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ненным*. Например, коэффициент а12.з4 Показывает степень влия- 
ния случайной величины X2 на случайную величину Х, при устра- 
нении влияния Хз и X4- 

Математический смысл коэффициента aj; для множественной 
регрессии тот же, что и для парной (простой регрессии), — это 
угловой коэффициент, равный тангенсу угла наклона проекции 
условных средних 21.2з..м Ha плоскость Х:ОХ;. Однако содержал 
тельная физическая интерпретация aj; как «веса» или меры вхо- 
ждения /-й переменной в i-10 в буквальном смысле допустима толь- 
ко для однородных систем. Например, если все Х; — это баллы, 
набранные индивидом за выполнение N—1 заданий, a Х; — это сум- 
ма баллов, характеризующая общую успешность его достижений, 
то Gj; могут выражать степень трудности или важности заданий, 
или оригинальности исполнения и т.п. 

Иным является смысл коэффициента регрессии а;;, если пере- 
менные i и j неоднородны. Здесь ау; есть мера направленного BAU- 
anus }-й Ha -ю переменную, причем влияние понимается как сто- 
хастическая связь, в частном случае — как корреляция. При этом 
сами связанные величины могут быть количественными, количе- 
ственными и качественными или только качественными — во всех 
случаях абсолютная величина |a;;| характеризует степень (силу) 
одностороннего влияния }-Й на {-ю переменную, а знак (плюс или 
минус) — направление влияния (положительное или отрицатель- 
ное, соответственно, как это было показано для двух случайных 
величин). 

Рассмотрим геометрическую интерпретацию М№-мерной систе- 
мы в регрессионном аспекте. 

Регрессионным подграфом 1-й случайной величины (i-m регрес- 
сионным подграфом) будем называть совокупность из N вершин, 
обозначающих случайные величины, из которых каждая ]-я со- 
единена с 2 (7 # i) стрелкой (дугой), обозначающей парциаль- 
ное влияние }-йЙ случайной величины на 1-ю; кроме того, пусть 
в +-ю вершину «входит» дуга извне, что обозначает обусловлен- 
ность 1-Й переменной внешними, не рассматриваемыми в данной 
системе факторами (все множество таких факторов можно трак- 
товаль как N + 1-ю вершину 1-го регрессионного подграфа). Над 
или под дугами внутри системы (таких дуг М - 1) записывают- 
ся значения коэффициентов +й множественной регрессии. Около 
дуг, входящих в вершины извне (их № по числу вершин), надпи- 


*На самом деле это не так, и коэффициенты 212 И а1з в уравнении MHO- 
жественной регрессии 21 = 201 + а1222 + @1323 ме равны, хотя и близки 
по величине аналогичным коеффициентам в уравнениях парных регрессий 
21 = 001 + 81272 И 21 = G01 + 61323- 


Рис. 4.4. Представление множественных регрессий нь графах. 
4, би в — регрессионные подграфы социометрического статуса (1), 
нейротизма (2) и эмоциональной экспансивности (J) соответственно; 
г— регрессионный граф системы этих переменных. 


сываются коэффициенты множественной индетерминации а, № 
характеризующие влияние внешней среды на каждую Ёю пере- 
менную. Регрессионные подграфы для случая трех переменных 
представлены на рис. 4.4, а, 6, в. В М№-мерной системе, очевид- 
но, имеется № i-x регрессионных подграфов, каждый из которых 
можно рассматриваль как некоторое событие А;. Тогда систему в 
целом можно рассматриваль как сумму совместных событий Aj. 
Peapeccuonnum зрафом системы будем называть граф, полу- 
ченный объединением всех регрессионных подграфов (рис. 4.4, г). 
Регрессионному графу соответствует несимметричная квадрат- 
ная матрица порядка №, внедиагональными элементами которой 
являются коэффициенты множественной регрессии ацу, а диаго- 
нальные элементы — это коэффициенты акорреляции В; 2з..м (см. 
табл. 4.8). По сравнению с корреляционным регрессионный граф. 
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дает более обширную информацию об изучаемой системе, так как 
«расщепляет» взаимосвязи между переменными до направленных 
связей, характеризуемых различной силой влияния. 

Как и для простой, для множественной регрессии угловые ко- 
эффициенты можно выразить в стандартной форме (в масштабе 
стандартных отклонений), нормируя соответствующие коэффици- 
енты частной корреляции отношением стандартных отклонений. 
В общем виде имеем 


(4.25) 


Где 7ij.23...V — коэффициенты частной корреляции й-го порядка, 
определенные выше формулой (4.9); 04.23..." И 0;2з.м-— Условные 
стандартные отклонения iA и )-Й случайных величин соответ 
ственно; эти отклонения получаются из дисперсий, определяемых 
по формуле (4.11), извлечением корня квадратного. 

Коэффициенты множественной регрессии мбжно представить 
иным образом: 


(4.26) 


при 
(4.27) 


где В+; — стандартизированные коэффициенты регрессии (так на- 
зываемые В-коэффициенты); 0; и о; — безусловные стандартные 
отклонения 1-Й и ]-Й случайных величин. Замена коэффициентов 
линейной множественной регрессии В-коэффициентами означает в 
сущности переход от самих величин Xj к их основным отклонени- 
ям: 

on = HMO) 


= М 
7 = 12.0 


в результате чего уравнение множественной регрессии вместо BH- 
да (4.24а,6) приобретает вид 


Noi 
изм = Dy Auth (4.28) 

iA 
где свободный член ао; отсутствует. Коэффициенты В;; показыва- 
ют, на какую долю своего стандартного отклонения Oj изменится 
1-я случайная переменная, если влияющая на нее 3-я переменная 

изменится на gj, а все остальные аргументы не изменятся. 

В качестве примера интерпретации множественной регрессии 
вида (4.28) приведем одно из так называемых уравнений «успеш- 


ности», полученное Р. Кеттелом* в результате исследований аме- 
риканских школьников (мальчиков и девочек в возрасте около 12 
лет): 

Х: = 0,2Х2 + 0,5X3 + 0,3X4 — 0,2Xs5 — 0,2Х5+ 
+ 0,4Х7 +0, 2Xg —0,2Хъ — 0, 2X19 + 0,3X11 — 0, 1X12, 


где Х: — школьные достижения в английском языке и арифме- 
тике; X2 = Х!2— полярно характеризуемые свойства личности 
школьников: Хэ— аффектотимия — шизотимия; Хз— интеллекту- 
альность — неинтеллектуальность; Х4 — сила «я» — общая эмоци- 
ональность; Хь — возбужденность — неуверенность; Хз — беспеч- 
ность — озабоченность; Хт— совестливость (сила— слабость 
«сверх-я»); Хз — смелость — робость; Хэ — мягкость — жесткость; 
X19 — мечтательность — практичность; Х!1 — самолюбие и само- 
контроль; Х12— напряженность потребностей — расслабленность. 
Очевидно, что при а; = 0 или, что то же самое, (jj = 0 линейное 
влияние X; на условные средние значения Х; отсутствует, т.е. эти 
переменные некоррелированы (это не означает отсутствия других 
видов стохастической связи). 

При изучении многомерной системы перед исследователем 
обычно могут возникнуть три задачи, различающиеся по степе- 
ни проникновения в структуру связей переменных. 

Первая задача состоит в том, чтобы установить факты связей 
и их направление. Решению этой задачи служит регрессионный 
анализ, который заключается в определении коэффициентов ре- 
грессии и анализе их статистической достоверности. Развитием 
методов регрессионного анализа является дисперсионный анализ 
(глава 6). 

Bmopas задача состоит в том, чтобы выявить факты парных вза- 
имосвязей в системе и установить их достоверность. Решается 
эта задача вычислением ковариационной и интеркорреляционной 
матриц с их последующим анализом. 

Третья задача состоит в том, чтобы вскрыть глубинные груп- 
повые взаимосвязи (по три, по четыре и т. д. —по №) между пере- 
численными в системе. Решению этой задачи служит вычисление 
коэффициентов частной и множественной корреляции с последую- 
щим исследованием их статистической достоверности путем кор- 
реляционного анализа. Разновидностью корреляционного анали- 
за является способ корреляционных плеяд*. Углублением и разви- 
THEM идей корреляционного анализа является факторный анализ 
(глава 7). 


“Cattell R.B. The Scientific Analysis of Personality. Chicago, 1966, Р.310-312. 
"Терентьев П.В. Метод корреляционных плеяд// Вести. Ленингр. 
ун-та. 1959, №9. 
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Основные идеи и методы регрессионного и корреляционного 
анализа мы рассмотрим в главе 5. Здесь же изложим в общем 
виде процедуры определения необходимых числовых характери- 
стик, которые далее подкрепим примером. 

В соответствии с тремя задачами можно вести исследование 
многомерной системы тремя способами. 

Первый способ сводится к вычислению непосредственно коэф- 
фициентов множественной регрессии по методу наименьших ква- 
дралов. Так как множественную регрессию можно построить для 
любой из М случайных величин, считая ее зависимой от осталь- 
ных, то всего необходимо получить № ‘уравнений: 


21 = do, + 41222 +--+ @м7М, 
22 = а0з + 47121 + `` + азмтм, 


хм = don + ам1т1 + ---+амм-12м-1, 

в которых все коэффициенты 4); и свободные члены ао; могут быть 
различны как по значениям, так и по знакам. Чтобы найти неиз- 
вестные коэффициенты ау; и ао; для каждой 1-й множественной ре- 
грессии, необходимо построить и решить систему из N нормаль- 
ных уравнений. 

В общем виде процедура получения системы нормальных урав- 
нений включает в себя две операции, повторяющиеся последова- 
тельно N раз (j = 1,2,...,N). Тогда 1-е нормальное уравнение 
получается: 

1) умножением исходного уравнения 1-Й множественной регрес- 
сии 


т; = Agi = 64222 + `` + мм 


на 2; почленно: 
вт) = аца; аптот; ++ цмтмт;, (4.29) 


причем при j =i полагают 2; = 1; 
2) суммированием результатов (4.29) почленно: 


A (i г 
У ги; = an: 32 25 + ava So 228y ++ шн Danes, 
ral rol 


где п— число наблюдавшихся (группами по №) значений случай- 
ных переменных; г = 1,2,...,п— индекс наблюдения; при j=i, 
очевидно, №, Goi = nao: 

В итоге получается метасистема из N’ 2 уравнений, решая ко- 
торые можно определить все искомые коэффициенты и свободные 
члены множественных регрессий. Нетрудно понять, что уже при 
N = 4 приходится решаль 16 уравнений, значит, для исследования 
многомерных систем полезно применять компьютер. 


Второй способ заключается в том, что первоначально вычи- 
сляется корреляционная матрица. Залем с помощью ry; строит- 
ся № систем нормальных уравнений в /;-коэффициентах (всего 
для +-й множественной регрессии — М-1 нормальное уравнение)*, 
решением которых определяются все В;;. Чтобы от стандарт- 
ного перейти к натуральному масштабу, по формуле (4.26) надо 
вычислить все а;. Свободные члены не определяются через й- 
коэффициенты непосредственно. Поэтому дополнительно соста- 
вляют N уравнений вида, 


N-1 
&- Do ayz;, (4.30) 
aft 


aoe 


rae Tw 
личин. 


— безусловные средние арифметические случайных ве- 


Третий способ—это вариант второго способа, дополненный 
вычислением по формуле (4.9) коэффициентов частной корреля- 
ции первого и более высоких порядков. После этого по форму- 
ле (4.27) вычисляют й,;-коэффициенты или непосредственно по 
формуле (4.25) — а;;-коэффициенты и по (4.30) — свободные члены. 

Отметим в заключение, что коэффициент множественной корре- 
ляции Вх. 2з.м вычисляется при исследовании №-мерной системы 
по второму и третьему способу либо по формуле (4.12), либо через 
Ру-коэффициенты — по формуле 


М-1 
> rij Biz, 


i#t 


№2 м= (4.31) 


где все обозначения прежние. При использовании первого способа 
можно оценить (без расчета ту; и 6; ) коэффициент множественной 
‘детерминации по формуле (4.10), где остаточная дисперсия 


1 
= Lee — валы) 


И 2, — наблюдавшиеся, а 24.2. м — вычисленные по множествен- 
ной регрессии значения переменной X;. 


*Как ото делается, рассмотрим ниже, в примере 4.1. 


11, ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ 
ВЕЛИЧИН ПО ДАННЫМ ЭКСПЕРИМЕНТА 


111. Оценка вероятностей многомерного распределения 
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Выявить полное №-мерное распределение по эксперименталь- 
ным данным — задача непростая. Часто ее пытаются обойти, 
ограничиваясь совокупными числовыми характеристиками, для 
расчета которых есть готовые программы в вычислительных цен- 
трах. Но это некорректно. Знать полные распределения не- 
обходимо и для решения важнейших социолого-психологических 
проблем — например, проблема наличия в различных социаль- 
ных общностях людей с теми или иными психическими свойства- 
ми, — для адеквалного моделирования генеральных совокупностей 
и проектирования репрезентативных выборок (см. §5.1). 

Оценить полное многомерное распределение вероятностей мож- 
но либо по данным специально организованного натурного иссле- 
дования в соответствии с формулами (4.1-4.3), причем по возмож- 
ности обобщая выборочные распределения частот, полученные в 
разных сериях или на разных этапах исследования; либо это мож- 
но сделать, используя статистику переписей, анкетные данные и 
другие сведения, которые необходимы и достаточны для того, что- 
бы восстановить полное многомерное распределение по уравнени- 
ям (4.5). 

Специфика исследования, целью которого служит оценка веро- 
ятностей многомерного распределения, состоит в TOM, чтобы со- 
вместно регистрировать значения всех интересующих исследова- 
теля случайных величин, образующих систему. Но при этом ко- 
личество необходимых, с учетом формулы (4.2), наблюдений или 
измерений быстро начинает превышать практические возможно- 
сти одного исследователя. Чтобы уменьшить требуемое число 
наблюдений, следует квантовать изучаемые величины на двух, 
максимум трех уровнях, затем спланировать нужное для репре- 
зентативности результатов число наблюдений (см. $5.1) и только 
после этого осуществлять эмпирическое исследование. Разуме- 
ется, для предварительных оценок и без далеко идущих выводов 
можно получить эмпирическое распределение, просто группируя 
имеющиеся данные, подсчитывая частоты и частости совмещения 
наблюдавшихся значений нескольких случайных величин. 

Пример 4.1. В комплексном исследовании личности были по- 
лучены оценки социометрического статуса в своей учебной груп- 
пе (Х!), нейротизма по Айзенку (Хз) и эмоциональной экспансив- 
ности (Хз) студентов, представленные в табл. 4.3. Несмотря Ha 


малочисленность данных (всего 42 человека), продемонстрируем 
оценивание вероятностей совместного распределения социометри- 
ческого статуса, нейротизма и эмоциональной экспансивности. 


Таблица 4.5 
Исходные данные к примеру 4.1 
Х; — социометрический статус в rpynne, %; 
Хз — нейротизм и Хз — эмоциональная экспансивность, баллы 


1 

3 

—1 

з4 

13 

9 

12 

22 

16 -17 29 

17 9 2 

21 -2т 7 

22 25 40 

9 7 6 40 

8 23 33 20 

15 и —2 -50 

4 12 34 19 
-8 15 
-0,7 12 
—15 13 

Суммы 


Для группировки данных расчленим значения каждой перемен- 
ной на два уровня, как показано в табл. 4.4. Осуществляем груп- 
пировку, кодируя в пятеричной системе (как и прежде) факт по- 
явления события Ajim, состоящего в TOM, что на пересечении 
j-ro, k-ro и т-го уровней (j = 1,2;k = 1,2;m = 1,2) появится 
«тройка» значений Х\, Хз, Хз. Например, для первой в табл. 4.3 
«тройки» значений [(X, = 1)(X2 = 18)(Хз = 3)] имеем событие 
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Таблица 4.4 


Группировочная таблица для расчета оценок вероятностей Рук» 
по данным эксперимента 
(Обозначения в тексте) 


| т = X2 < 13,5 Zaz = X2 > 13,5 
| 221 = Х: <0 | 232 = Хз 20 | хм = Хз <0 
ш 1 
Ла Ла =1 
ти ЕХ,; <0 Риз = 0,07 Py22 = 0,02 
Риз = 0,10 р, = 0,08 
wy TT пи wu Tir 
4 аа = И 
т2=Х:20 0,34 Рош = 0,26 
Phy = 0,13 | Ру. =0,28 Pyog = 0,23 
| 
Суммы ote! Dhar Lier Lines Ак = 42) 
а Dine Рит = за Уна Dinar Рат 2 1 
Аза = [(X1 = 212)(X2 = 222)(Xs = 2з2)], которое кодируем палоч- 


кой в соответствующей (правой, нижней) клетке табл. 4.4. Окон- 
чив группировку, подсчитываем частоты fiem = Ат, суммы 
частот и оценки вероятностей Pjem = $ fim (см. табл. 4.4). Сово- 
купность этих оценок и характеризует совместное распределение 
социометрического cTaTyca, нейротизма и эмоциональной экспан- 
сивности у 42 студентов. 

Оценим, далее, степень стохастической связности системы, 
пользуясь коэффициентом совместной детерминации (4.15). Если 
социометрический статус, нейротизм и эмоциональная экспансив- 
ность независимы в совокупности, то для всех j, Кит должно 
выполняться условие 


Ру = PP Pu 


Следовательно, вычисляя все оценки безусловных вероятностей 
по формуле (4.4) — результаты представлены в табл. 4.5, — можем 
далее определить и оценки Ру,„ в предположении независимости 
переменных (эти оценки приведены в табл. 4.4). Так как в группи- 
ровочной таблице (табл. 4.4) =2и9 = 4, то, выполнив расчеты 


is Таблица 4.5 
условные эмпирические распределения величин социомстрического. 
prruce) 
статуса (X;), нейротиэма (Xz) и эмоциональной экспансивности (Хз) 


anaX, | дляХз ‘для Ху 
г |Р | [РА | ат | Pm 
ти 0,26 та 0,55 21 0,31 
212 0,74 та | 0,45 232 | 0,69 
Der [1,00] SE, Pe | 1,00] 3, Pm [1,00 


по формуле (4.15), получаем К = 0,128 и Км < 0,36, что сви- 
детельствует о наличии слабой совместной стохастической связи 
рассматриваемых переменных. Значит, в принципе имеет смысл 


определять и условные распределения, но это выходит за рамки 
нашего примера. 


Mit Определение множественных регрессий и связанных с ними числовых характеристик 


Используем для демонстрации исходные данные примера 4.1. 
Первый способ— непосредственный расчет коэффициентов множе- 
ственных регрессий— требует составления трех систем по три 
нормальных уравнения в каждой. 

Пользуясь алгоритмом составления нормальных уравнений {-й 
множественной регрессии, составим их для регрессии 


21.23 = 401 + а1222 + а1з2з. 


Умножая на 2; = 1 и суммируя по числу наблюдений (г = 
1,2,...,42), получаем первое нормальное уравнение: 


42 42 42 
Yai = 42а + a2 Уаз zs. 
ral 


rst r=l 


Умножая исходное уравнение на 22 и суммируя, получим второе 
нормальное уравнение: 


42 42 42 42 
Ува: = аа Do 22 +412 S23 + 3 > 2225. 
‚= = 71 ral 


Умножая исходное уравнение на 23 и суммируя, получим третье 
нормальное уравнение: 


42 42 42 42 
Lares = a0) ) 23 + a12 У 223 + a3 =. 
rat val 


rs ral 
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Аналогичным образом получаем и две другие системы нормаль- 
ных уравнений, для переменных 22 И 23 соответственно: 


Sy, 22 = 42a02 + a21 DO, 21 + 423 D, 23, 
Dy 2201 = doz Dy 21 +421 Dy 21 + 423 Ly 2173, 
YO, тотз = 402 Dy 13 + 421 Dy 2123 + 423 Dy 733 


Dy x3 = 42403 + a31 DO, 21 + 432 Dy 22, 

У. 321 = a03 DO, 21 +031 Dy 27 + as2 Dy 2122) 

Sy eaz2 = a03 Dy 22 + 431 Dy 2122 + O32 Dy, 23. 
Чтобы определить все девять неизвестных (3 свободных члена и 
6 коэффициентов множественных регрессий), необходимо по ис- 
ходным данным (см. табл. 4.3) вычислить суммы значений каждой 
переменной, квадратов значений и парных произведений. Проме- 
жуточные значения и суммы квадратов и произведений предста- 
влены в табл. 4.6. Теперь можем записать в явном виде: 


1394,6 = 555ао1 + 8331а12 + 3969а1з, 
3678,7 = 374a01 + 396912 + 20292а1з; 
555 = 42ао2 + 140, Заз: + 374а2з, 

ДЛЯ 12 13 | 


140,3 = 42ао1 + 555а12 + 374а1з, 
ДЛЯ 21 23 


1394,6 = 140, Заоз + 4290а21 + 3678, 7423, 
3969 = 374а02 + 3678, Таз + 20292а2з; 
374 = 42аоз + 140, Заз1 + 555аз?, 
для 2312 < 3678,7 = 140, Заоз + 429043; + 1394, 6a32, 
3969 = 555аоз + 1394, бази + 8331аз2. 
Решая эти системы уравнений любым известным способом, полу- 
чаем приближенные значения шести а; (они приведены в табл. 4.8) 
и свободных членов: 
ao, = 6,73; @02 = 13,9; аоз = 16,4. 
Теперь можем записать искомые регрессии: 
21.23 = 6,73 — 0, 3422 + 0, 12423, 
2213 = 13, 9-0, 0921 — 0, 04z3, 
23.12 = 16,4+ 0,5522 — 0,7121. 
Заметим, что, пользуясь найденными множественными регрес- 
сиями, можно определить коэффициенты множественной детерми- 
нации следующим образом: 


1 42 
Пе 2 
= 1- gp les =, 


Тоблица 4.6 
Промежуточные значения м расчету коеффициентов множественных 
регрессий, новариаций и нозффициентов парной корреляции 


= Е Е Е 

1 324 64 49 64 56| -64|] -56 
81 400 64 25 324 40| 144 90 
484 324 4 289 1 —34 -2 17 
121 484 784 144 9 | -336| —84 36 
36 81 4 81 + 18 -2 -9 
'0,25| 144 225 144 1126 180} 510} 408 
25 169 100 54 169 -80| -130 104 
81 256 16 81 81 36 36 81 
о 196 361 9 144 7 228 36 

4 256 4 225 484 30 а 330 
121 256 36 196 ‘841 84| 174 406 
225 289 289 81 484 153| 374 198 
64 441 49 196 49 98 49 98 
о 484 64 49 1600 56 320 280 
81 49 16 169 1600 52 160 520 
64 529 49 36 400, 42 140 120 
225 121 81 256 | 2500 144 | —450 | -800 
16 144 16 144 361 48 76 228 
64 225 0,25} 400 100 10 5 200 
0,49) 144 64 144 о 96 0 о 
225 169. 81 64 576 72| 216 192 
Суммы 4290,0 |8331.0|20292.0| 1394,6] 3678.7 |3969,0. 


где О; — безусловная дисперсия, определяемая обычным путем: 
Di = & Dele: — М(24)]; =: — эмпирические значения i-tt пере- 
менной; 27 — вычисленные по {-й множественной регрессии ожи- 
даемые значения {-Й перемённой. Не вычисляя здесь 12, отметим, 
что всегда п? > R?, где В? — коэффициент линейной детерминации, 
определяемый формулой (4.12) или (4.31). 

По второму способу вычисления начинаются с определения зна- 
чений элементов ковариационной матрицы, стандартных отклоне- 
ний, а затем и парных коэффициентов корреляции, причем исполь- 
зуются те же самые суммы из табл. 4.3 и 4.6. Результирующие ко- 
вариационная и корреляционная матрицы и значения стандартных 
отклонений приведены в табл. 4,7. По корреляционной матрице по- 
строим корреляционный граф рассматриваемой системы — он изо- 
бражен на рис. 4,3. 
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Таблица 4.7 
Ковариационная (в) и корреляционная (6) матрицы, 
безусловные стандартные отклонения переменных первой выборки (+) 
к примеру 4.1; корреляционная матрица (2) второй выборки 
к примеру 5.5 
X; — социометрический статус нь курсе, Х2 — нейротизм, 
„Хз; — эмоциональная экспансивность 


х | № Xs 
xX 91,0 фи 58,0 
а | № | -1,1 24,0 —23,0 
X3 58,0 -23,0 404,0 
x 1 0,238 0,302 
6 | Х2 | -0,238 1 0,234 
№ 0,302 | -0,234 1 
e <: 9,54 | 4,50 | 20,10 
x 1 0,276 0, 162 
2 Хз -0, 276 1 —0, 347 
Xs 0,162 | -0,347 1 


Системы нормальных уравнений для вычисления [:;-коэффици- 
ентов получим следующим путем. 

1. Выберем из корреляционной матрицы подматрицу, удаляя 
строку и столбец той переменной, которую считаем зависимой. 
Так, для социометрического статуса (Х1) — подматрицу (1), для 
нейротизма (Х2) — подматрицу (2), а для эмоциональной экспан- 
сивности (Хз) — подматрицу (3): 


1 raat (1). 1 ris] (2). 1 ne 
о [A Flo [1 Flo 
2. Сформируем для каждой из этих подматриц диагональную 


подматрицу В;-коэффициентов (где { — номер зависимой перемен- 
ной, } — номера независимых): 


Bo 0 . [Aa 0 . [Fa 0 
(polo [№ pox [% ro] ® 
3. Перемножим слева подматрицы парных коэффициентов и со- 


ответствующие подматрицы Д-коэффициентов. В результате по- 
лучим 


2 rashis (1); Ba 1382s (2); Bsr og (3) 
rasi2 Bis * [risBa Bas * [ri28s1 Bsa ‘ 
где 012 = far, Яз = Вз1, B23 = [32 так же, как и для парных коэф- 
фициентов корреляции. 
4. К каждой полученной подматрице построчно припишем сле- 
ва через знак равенства коэффициенты корреляции из удаленного 


ранее столбца, а элементы справа от знака равенства суммируем: 


12 = Bia + 72313 (1; "= Bar + г1з 83 (2); 
г13 = Tashi + Ais * таз = тазВи + Bas J 0°" 
713 = Bai + 712832 (3) 
T23 = 712831 + Bs2 2 
Подставляя из исходной корреляционной матрицы значения гу, 
запишем системы нормальных уравнений в явном виде: 
{ —0, 238 = 12 — 0, 2341з, 
0,302 = —0, 234612 + Ais; 
—0, 238 = Ва +0,3026:з, 
—0, 234 = 0,3021 + Ваз; 
{ 0, 302 = B51 — 0, 23832, 
—0, 234 = —0, 238 Вал + Вз2. 
Решая эти системы, получим следующие приближенные значения 
В-коэффициентов: 
В: =-0,184, Взз =-0,172, 13 = 0,261, 
Ва =-0,177, B23 =-0,179, 8, = 0,261. 
Можно видеть, что различия между «симметричными» В-коэффи- 
циентами малы (эти различия вызваны округлением исходных т4у- 
коэффициентов). 

Вычисляя теперь по формуле (4.26) коэффициенты множествен- 
ных регрессий, получаем те же значения (табл. 4.8). Далее, 
по формуле (4.31) определяем значения линейных коэффициентов 
множественной детерминации: 

82 = 0,121; 82.3 = 0,086; R24. +0,119, 
а по формуле (4.13) — коэффициенты множественной акорреляции, 
приведенные по диагонали табл. 4.8. Изображая полученные мно- 
жественные регрессии в виде регрессионных подграфов, как пока- 
зано на рис. 4.4,а, би в, можем затем объединить их в регрессион- 
ный граф (рис. 4.4, г), матрица которого дана в табл. 4.8. 


Таблица 4.8 
Матрица регрессионного графа на рис. 4.4 
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Третий способ дополняет проделанную работу вычислением ко- 
эффициентов частной корреляции. В нашем случае трех перемен- 
ных по формуле (4.8) получаем 


таз -0,181, г1з2 А 0,261, ras. —0, 175, 


после чего можем проверить найденные выше значения В? по фор- 
муле (4.12) и значения aj; по формуле (4.2.18) — вычисления пра- 
Вильны. 

Попытаемся теперь содержательно интерпретировать получен- 
ные регрессии и корреляции на качественном уровне. Корреля- 
ционный граф (рис. 4.3) показывает, что нейротизм отрицатель- 
‘ным образом взаимосвязан со статусом и эмоциональной экспан- 
сивностью, которые, в свою очередь, взаимосвязаны положитель- 
но. Во взаимосвязях, отображаемых т;;, аккумулировано, однако, 
влияние третьей переменной. Парциальные коэффициенты гу» 
«снимают» это влияние. Действительно, можем видеть, что ка- 
ждая из переменных «усиливает» взаимосвязь двух остальных 
(все rijm < тб). Вот, пожалуй, и все, что можно сказать на осно- 
вании гу; И г:; т, причем не более чем в гипотетическом плане. 

Гораздо больше сведений дает нам регрессионный граф 
(рис. 4.4). Прежде всего, можно видеть, что взаимовлияния на 
деле оказываются почти односторонними влияниями. `Действи- 
тельно, влияния социометрического статуса и эмоциональной экс- 
пансивности на нейротизм столь малы по сравнению с влияни- 
ем нейротизма на эти переменные, что ими можно пренебречь. 
Нейротизм выступает как одна из причин, обусловливающих со- 
циометрический статус личности и ее эмоциональную экспансив- 
ность. Влияние социометрического статуса на эмоциональную 
экспансивность более чем в 4 раза выше обратного влияния, что 
прекрасно подтверждает известное положение преимущественно- 
го обусловливания социального поведения социальным окружени- 
ем. Заметим, что характер влияний в системе, вскрываемый ре- 
грессионным графом, не выявляется отдельными регрессионными 
подграфами. Отсюда вытекает необходимость регрессионного ис- 
следования системы в целом. 

Представляет интерес оценка стохастической связности систе- 
мы рассматриваемых переменных, полученная в виде коэффици- 
ента совместной детерминации КЗ = 0,128. Заметим, что, дей- 
ствительно, совместная детерминация больше наибольшей множе- 
ственной детерминации, оцениваемой R723 = 0, 121. Близость зна- 
чений К? и В? „з, возможно, свидетельствует о хорошем прибли- 
жении регрессий в системе линейными функциями. С другой сто- 
роны, как отдельные переменные, так и система в целом более об- 
условлены извне неконтролируемыми факторами, чем изнутри — 


ра другом. Это позволяет предполагать, что социометрический 
ус в группе, нейротизм и эмоциональная экспансивность с; 
рее входят в другие системы, чем сами образуют систему. Ta. 
ba Ее вытекает и из малых величин коэффициентов 
парной поры аи, на которых основаны все остальные показате- 
о неосторожным отбрасывать полученные сведения 
а основании малости величин г;;, так как эти сведения 


не противоречат известным тг иям 
'еоретическим поло: 
риментальным фактам. ma Е 


14, СЛУЧАЙНЫЕ ФУНКЦИИ 


4.4.1, Свойства и количественные характеристики случайных функций 
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В начале главы мы говорили о случайной функции как о системе 
случайных величин. Это не единственно возможное определение, 
но мы ограничимся им при дальнейшем изложении. 

Случайная функция У(Х), заданная на множестве п своих ре- 
ализаций у;(Х) (где j = 1,2,...,n), принимающих значения yj (2) 
(rae # = 1,2,...,N) на множестве № фиксированных значений 2; 
аргумента Х либо значений интервалов квантования Ai, средни- 
ми значениями которых выступают 2;, полностью определяется 
М№-мерным распределением вероятностей Р(у;(г:], которые в прин- 
ципе ничем не отличаются от вероятностей Р;к.. т, рассмотренных 
выше. 

Обычно для непрерывных аргументов число N интервалов 
квантования, необходимое для изучения случайной функции У(Х), 
должно быть порядка сотен и тысяч*. Поэтому в общем слу- 
чае даже для случайных функций одного аргумента определить 
функции или плотность распределения не представляется возмож- 
ным. Лишь для сравнительно редких видов случайных функций, 
как будет отмечено ниже, могут быть заданы распределения. В 
большинстве случаев приходится ограничиваться количественны- 
ми характеристиками отдельных свойств многомерного распреде- 
ления случайной функции. 

Случайная функция одного аргумента Y(X), реализации кото- 
рой рассматриваются на плоскости (см. рис. 4.2), характеризует- 
ся теми же свойствами, что и система случайных величин: поло- 
жением, рассеиванием и связностью (асимметрия и эксцесс обыч- 
но не рассматриваются). Но в отличие от случайной величины 


“Романенко А.Ф, Ceprees Г.А. Вопросы прикладного анализа слу- 
‘чайных процессов, M., 1968. 


или системы эти же свойства у случайной функции выражаются 
количественно не с помощью числовых мер, а посредством неслу- 
чайных функций, образуемых мерами положения, рассеивания и 
связи от того же аргумента Х. 

`Математическим ожиданием случайной функции У (Х) называ- 
ется неслучайная функция M[Y(X)], которая при каждом фиксиро- 
ванном значении аргумента 2; равна условному среднему арифме- 
тическому значению случайной функции M(y/z;), определенному 
для всех возможных реализаций У(Х). Таким образом, матема- 
тическое ожидание случайной функции — это регрессия условных 
средних «у по 2». Математическое ожидание случайной функции 
можно рассматривать как некоторую среднюю из возможных ре- 
ализаций. 

Математическое ожидание случайной функции имеет те же 
свойства, что и среднее арифметическое значение суммы и произ- 
ведения случайных величин (4.17), (4.20) и (4.21), только речь идет 
уже о суммировании или умножении не чисел, а функций. Так, ма- 
тематическое ожидание простой суммы из К случайных функций 
одного и того же аргумента равно сумме математических ожида- 
ний слагаемых: 


к Е 
м ba vas] = Ум, (x), 
rat 


Л: 


В частности, прибавление к случайной функций У(Х) неслучай- 
ной функции p(X) увеличивает математическое ожидание случай- 
ной функции на эту функцию: 


M[Y(X) + ¥(X)] = М[У(Х)] + ¥(X). 
Это позволяет центрировать случайную функцию, вычитая из ее 
значений значения математического ожидания для тех же значе- 


0 
ний аргумента. Центрированная случайная функция Y(X) есть 
функция центральных отклонений, заданная на множестве значе- 
ний аргумента: 


¥(X) = У(Х) - МИХ), 


(4.32) 
x нь М. 


Умножение случайной функции на неслучайную функцию того же 
аргумента $(Х) увеличивает математическое ожидание в Y(X) 
раз: 

M[¥(X)¥ (X)] = ¥(X)M[Y (X)]. 
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Это свойство позволяет нормировать случайную функцию какой- 
либо неслучайной функцией, чаще всего стандартным отклонени- 
ем. 

Дисперсией случайной функции У(Х) называется неслучайная 
функция D[Y(X)], значение которого для каждого из значений ap- 
гумента есть условная дисперсия D(y/z;), определяемая также 
рассмотренными уже способами. 

Среднее квадратическое (стандартное) отклонение случайной 
функции есть неслучайная функция o[Y(X)], значения которой для 


всех 2; 
oly/zi] = VD(y/zi). 


Очевидно, что D[Y(X)] и в«[У(Х)] —это регрессии условных дис- 
персий и условных стандартных отклонений значений случайной 
функции при всех значениях аргумента, — регрессии, характери- 
зующие рассеивание реализаций случайной функции на плоскости 
(см. рис. 4.2) 

Свойство связности для случайной функции есть свойство бо- 
лее быстрой (или медленной) изменчивости ее значений по мере 
изменения аргумента (рис. 4.5). Степень (сила) связи между лю- 
быми двумя значениями случайной функции характеризуется ав- 
токорреляционной функцией. 


Ух) а Ух) 5 
= x Oe 
Puc. 4.5. Свойства связности случайной функции. 


а— сильно связная функция, ее изменения медленны; 6 — слабо 
связная функция, ее изменения быстры. 


Автокорреляционная (корреляционная, ковариационная) функ- 
ция КГ У(24),У(2;)] случайной функции У(Х) есть неслучайная 
функция двух значений 2;,2; того же аргумента, которая для ка- 
ждой пары условных распределений «у по 2» численно равна ко- 
вариации: 


K(¥ (2), Y(z))] = COV в] й 


Распространено и другое обозначение корреляционной функции. 
Пусть 2 — некоторое произвольное значение аргумента, принятое 


за начало отсчета. Выберем новое значение аргумента х + т, где 
O<T< Tmax 


называется «сдвигом» аргумента. Тогда корреляционная функция 
есть регрессия ковариаций, определенных для всех т: 


Kyy(r) = КУ), ¥(2+7)] = COV от + a , 


о 0 
rae Y(z) и У(г+т) — центрированные значения случайной функции 
в условных распределениях y/z и у/= +т. 

Важное прикладное значение имеют свойства корреляционной 
функции: 

1) она симметрична относительно ординаты; 

2) она равна дисперсии случайной функции при т = 0 (анало- 
гично тому, как СОУ[ХХ] = D({X]); 

3) она убывает до нуля при увеличении т: 

— монотонно (рис. 4.6, а), если случайная функция не содержит 
периодических неслучайных компонент; 

— колеблясь вокруг оси абсцисс (рис. 4.6, 6), если такая периоди- 
ческая компонента имеется; при этом частота колебаний Куу(т) 
соответствует основной частоте колебаний периодической компо- 
ненты, чем и пользуются на практике для гармонического анализа, 
случайных величин*; 


Kyy (*) 


Puc. 4.6. Автокорреляционная функция случайной функции в 
зависимости от сдвига т. : 
Объяснения в тексте. 


*Сергесв Г.А., Павлова Л.П., Романенко А.Ф. Статистические 
методы исследования электроэнцефалограммы человека. M., 1968. 


4) она убывает, монотонно или колеблясь, до некоторого посто- 
янного значения с? (рис. 4.6, в), где с есть стандартная ошибка 
центрирования случайной функции и вычисления дисперсий и ко- 
вариаций. 

Величина т, при которой корреляционная функция достигает 
оси абсцисс или асимптоты с? (монотонно либо колеблясь), назы- 
вается интервалом корреляции. Он показывает, для какого изме- 
нения аргумента значения случайной функции взаимозависимы. 
Если интервал корреляции т = 0, то значения реализации слу- 
чайной функции образуют последовательность, аналогичную цепи 
Бернулли. Если интервал корреляции т = 2141 — 2; = 1, то зна- 
чения каждой реализации случайной функции образуют простую 
цепь Маркова. 

Случайная функция, каждое значение которой выражено в еди- 
ницах стандартного отклонения при соответствующем значении 
аргумента, называется нормированной. Центрированная и нор- 
мированная случайная функция задается своими основными от- 
клонениями. 

Корреляционная функция нормированной случайной функции 
называется нормированной корреляционной (автокорреляционной) 
функцией. Она может быть получена двумя путями: либо как 


о 8 a 
K [vs (x) Ум (x + У] ‚ где Ук (*) — нормированные и центри- 


рованные значения случайной функции, либо нормированием зна- 
чений корреляционной функции при всех значениях сдвига т: 


Куу(т) 
ву(Х)ву(Х +7)" 


Можно видеть, что нормированная корреляционная функция есть 
регрессия по т парных коэффициентов линейной корреляции, вы- 
числяемых для всех рассматриваемых 0 < т < тих. Очевидно, 
что максимум Куу(т = 0) = 1, как и для г;;. Остальные рассмо- 
тренные свойства, корреляционной функции сохраняются. 

Свойство связности для случайной функции двух и более ар- 
гументов или для системы «одномерных» и «многомерных» слу- 
чайных функций не исчерпывается автокорреляцией и дополня- 
ется понятием взаимной корреляции. Соответственно здесь рас- 
сматриваются взаимно корреляционные функции и нормирован- 
ные взаимно корреляционные функции. 

Взаимно корреляционная (кросскорреляционная) функция слу- 
чайной функции двух аргументов Y(X,Z) или (что то же самое) 
двух «одномерных» случайных функций Y(X) и U(Z), рассматри- 
ваемых совместно, есть неслучайная функция всех пар значений z, 
= двух аргументов, образованная ковариациями соответствующих 


Ryy(7) = 
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условных распределений СОУуу(Х, 2) или СОУуг(Х, 2). Свой- 
ства взаимно корреляционной функции подобны свойствам корре- 
ляционной: 

1) она симметрична; 

2) она максимально равна произведению соответствующих стан- 
дартных отклонений: 


[Куу(Х, 2)]ьх = 0у(Х)оу(2), 
(Kyu(X, 2)ьх = 0у(Х)в0(2); 


3) если Kyy(X, 2 
если же Куи(Х, 2) 
релированы; 

4) нормированные взаимно корреляционные функции убывают 
от единицы до нуля, монотонно или колеблясь. 

Учитывая понятия авто- и взаимно корреляционных функций, 
можно выделить следующие практически важные свойства диспе- 
рсии и корреляционной функции для суммы случайных функций 
одинаковых аргументов. 

Дисперсия суммы случайных функций равна сумме максимумов 
автокорреляционных и взаимно корреляционных функций слагае- 
мых: 


В В 
D [sx] = оксик +} + 


0, то аргументы Х и 2 некоррелированы; 
|, то случайные функции У(Х) и U(Z) некор- 


ra tax 


DA, БУХ] 


R 
+{>e0.09,%007} » (4.38) 


г=1 


raer = 1,2...,R,i=1,2,...,.R5= 1,2,...,R. В частности, для 
некоррелируемых слагаемых 


В 
{xx} =0, 
= 


и дисперсия суммы есть только сумма дисперсии слагаемых. За- 
метим, что приведенные выше формулы дисперсии суммы случай- 
ных величин (4.18) и (4.19) — это частные случаи (4.33). 


Аналогично можем записаль и более общее равенство для кор- 
реляционной функции суммы случайных функций: 


в в R 
x ко] = У ких), УХ +7] + OK MX), YX), 


ral = 


где рассматриваются уже не только максимальные, HO любые 3Ha- 
чения сумм автокорреляционных и взаимно корреляционных функ- 
ций. В частном случае взаимной некоррелированности слагаемых 
функций последнее слагаемое обращается в нуль, поэтому корре- 
ляционная функция суммы некоррелированных слагаемых равна, 
сумме автокорреляционных функций этих слагаемых. 


141. Некоторые классы случайных функций. важные для психологии 
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Все разнообразие случайных функций классифицируется по не- 
скольким основаниям. 

По числу аргументов мы уже выделяли случайные функции од- 
ного аргумента («одномерныез) и двух и более аргументов («мно- 
гомерные»). В последнем случае рассмотрению подлежат метаси- 
стемы, Очевидно, ансамбли физиологических и психологических 
функций следует рассматривать именно таким образом. 

По физической природе аргументов принято выделять случай- 
ные процессы как случайные функции от времени. Для психоло- 
гов случайные процессы представляют особый интерес, так как 
все психические процессы, безусловно, являются случайными и 
должны исследоваться посредством аппарата теории случайных 
процессов. 

Классу случайных процессов противостоит класс случайных 
функций от других аргументов любой природы. Здесь предста- 
вляет интерес выделение случайных функций от многих аргумен- 
тов, природа которых различна. В психологических и смежных 
приложениях такими аргументами служат комплексы воздействий 
внешней и внутренней среды организма, включая не только слу- 
чайные, но и целенаправленные воздействия: педагогические, со- 
циальные, медицинские, 

Разумеется, что основной понятийный и вычислительный аппа- 
рат теории случайных функций не зависит от физической приро- 
ды аргументов. По тому, является ли аргумент и функция (как 
способ связи) случайными, можно выделить случайные функции 
неслучайных аргументов, неслучайные функции случайных аргу- 
ментов и случайные функции случайных аргументов. 


Типичными примерами случайных функций неслучайных apey- 
‘ментов служат результаты строго дозированных воздействий ле- 
карств, физических сенсорных стимулов или обучающих программ 
на людей. Результаты этих воздействий — соматические, физио- 
логические и психические состояния, а также социальное поло- 
жение — из-за флюктуаций внутренней среды организма являются 
случайными функциями. 

Неслучайные функции случайных аргументов мы рассматривали 
выше. Но следует добавить сюда любые инструментальные дей- 
ствия человека. 

Наконец, случайные функции случайных аргументов в общем ви- 
де, очевидно, охватывают большинство психических процессов и 
функций. 

По степени изменчивости количественних гарактеристик cay- 
чайной функции в зависимости от изменений аргумента выделяют 
стационарные, квазистационарные и нестационарные случайные 
функции. 

Стационарные случайные функции наиболее изучены. Случай- 
ная функция стационарна в узком смысле, если для всех значений 
аргумента ее условные распределения неизменны. Такая функция 
полностью определяется одномерным распределением. Случай- 
ная функция стационарна в широком смысле, если ее матемали- 
ческое ожидание и дисперсия суть константы (т.е. не зависят от 
аргумента), а корреляционная функция зависит только от сдвига. 
ти He зависит от начала отсчета. 

Нестационарной называют случайную функцию, для которой 
‘условия стационарности в широком смысле не выполняются. Если 
при этом изменения М[У(Х)} и D[¥(X)] не велики, a К[У(Х), У(Х + 
т)] слабо зависят от начала отсчета сдвига т, то случайную функ- 
цию называют квазистационарной. 

Для психологии чрезвычайно важно установить принадлеж- 
ность изучаемых психических процессов, состояний и свойств к 
стационарному или нестационарному классу функций. Дело в том, 
что подавляющее большинство статистических мер и методов раз- 
работано для условий стационарности, тогда как общеизвестны 
возрастная, сезонная, недельная, суточная и т.п. периодичность 
случайных изменений психики, а также ее изменчивость в зави- 
симости от целенаправленных обучающих и воспитательных воз- 
действий. Можно сказать, что большинство явлений психики не 
удовлетворяет условиям стационарности. И тогда задача иссле- 
дования может состоять в установлении областей значений аргу- 
ментов, для которых можно говорить о квазистационарности. 

По возможности заменить изучение множества реализаций слу- 
чайной функции изучением се одной, но достаточно длинной реали- 


В 
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зации выделяют эргодические и незргодические случайные функ- 
ции. 


Эргодическими называются случайные функции, для которых 
математическое ожидание и корреляционая функция, определен- 
ные по множеству реализаций, равны полученным по одной реа- 
лизации. Для незргодических они не равны. Очевидно, что все 
эргодические функции стационарны хотя бы в широком смысле. 


Для психологических исследований понятие эргодичности весь- 
ма важно. Ведь тщательное изучение одного человека экономиче- 
ски выгоднее, да и невозможно редкие психические явления из- 
учаль в большом количестве. С другой стороны, только для эр- 
годических процессов и функций результаты, полученные на мно- 
жестве людей, в короткий период времени могут быть перенесены 
на отдельных людей и, наоборот, результаты лонгитюдных ис- 
следований отдельных индивидов (или малых групи) могут быть 
справедливы для больших групп. Значит, необходимо исследо- 
вать психические явления на эргодичность, т.е. определять их 
количественные характеристики и по множеству, и по отдельным 
реализациям. 


‚ Определение характеристик случайной функции из эксперимента 


При экспериментальном изучении случайной функции можно 
выделить две ситуации: когда наблюдений достаточно для груп- 
пировки данных и определения оценочной функции распределения 
и когда наблюдений мало для этого, тогда определяются оценки 
математического ожидания, дисперсии и корреляционной функ- 
ции. 


Чтобы определить распределения случайной функции от одно- 
го аргумента, поступают так же, как для двух случайных вели- 
чин (глава 3). Не повторяя изложенного, для примера покажем 
лишь результат. В табл. 4.9 представлены условные распределе- 
ния частостей ошибки слежения за движущейся целью в функции 
от времени слежения, в условиях, когда испытуемый запаздыва- 
ет с реакцией*. Значения математического ожидания МУ ({)] и 
стандартного отклонения ошибки слежения в функции от време- 
ни o[Y(t)] приведены в нижних строках таблицы. Видно, что они 
изменяются, следовательно, слежение — нестационарный процесс. 


“Суходольский Г.В. О характеристиках человека при слежени: 
тореф. канд, дис. Л., 1968. 


Таблица 4.9 


'Условные распределения частостей ошибки слежения 
в функции от времени 
у— средние значения интервалов квантования ошибки слежения, мм; 
{— средние значения интервалов квантования времени, с 


0,25 | 0,75 3,25 | 3,75 | 4,25 


—2,8 |0,028 | 0,006 
—2,4 |0,035 0,010. 
-2,0 |0,115 | 0,020 | 0,001 0,001 | 0,001 0,001 
—1,6 |0,097 | 0,036 | 0,005 | 9,002 | 0,003 | 0, 004 | 0,008 | 0,001 0,003 
-1,2 |0,243| 0,081 | 0,045 | 0,025 | 0,019 | 0,015 | 0,014 | 0,021 | 0,013 | 0,016 
-0,8 |0,260 | 0,162 | 0,098 | 0, 110] 0, 102 | 0,092 | 0,058 | 0,061 | 0,067 | 0, 069 
-0,4 | 0,183] 0, 325 | 0,329 | 0, 302 | 0, 334 | 0, 304 | 0,353 | 0, 390 | 0,412 | 0,403 
о | 0,026] 0, 140 | 0,230 | 0,272 | 0, 285 | 0, 283 | 0,283 | 0,302 | 0, 289 | 0,337 
4 | 0,002 | 0,157 | 0,221 | 0,227 | 0,191 | 0, 236 | 0,212 | 0, 180 | 0,166 | 0, 128 
8 0, 044 | 0, 060 | 0, 054 | 0,058 | 0, 052 | 0, 061 | 0, 034 | 0,040 | 0,035 
2 0, 009 | 0, 006 | 0, 007 | 0,008 | 0,012 | 0,010] 0,010 | 0,012 | 0,006 
6 0,003 | 0,002 | 0, 001 0,002 - [0,001 
о 0,002 | 0,002 0,001 | 0,001 


MUY (t)]) —0,39]—0, 12|-0, 10] -0, 11]-0,07| -0, 07] —0, 08] -0, 12 
0,48 7 | 0,48 | 0,47 | 0,44 | 0,43 | 0,43 


Рассмотрим процедуру вычисления для количественных харак- 
теристик случайной функции. 

Пример 4.2. Пусть человек непрерывно прицеливается в дви- 
жущуюся цель в течение времени Т. Отклонения прицельного при- 
способления от цели в каждый момент времени { образуют ошибку 
слежения, величина которой (у) случайна. Таким образом, ошиб- 
ку слежения можно рассматривать как случайную функцию вре- 
мени, которую обозначим Y(t). Значения двадцати трех реализа- 
ций этой случайной функции для одиннадцати значений времени 
приведены в табл. 4.10*. 

Вычислив все условные средние арифметические М[У(1)] — они 
записаны в последней строке табл. 4.10, — случайную функцию 
центрируют по уравнению (4.32). Центрированные значения ошиб- 
ки слежения представлены в табл. 4.11. 

Чтобы устранить появление грубых ошибок центрирования, 


“Tam же. 


Таблица 4.10 
Реализации ошибки слежения к примеру 4.2 


2,25| 2,75 4,25 | 4,75 


|-0,2|-0,6 
-0,6] 0,4. 
|-1,1|-0,2 


{10,00 0,25 |0,75 
№ 


+0,2 +0, 5|+1,4 
+0,9 +0, 6]+0, 6] 
+0,3 -+0,4]+0,2 


+0,7 
--0,$|+0,02]-0,03]-0,1] -0,1 


обязательно вычисляют средние арифметические из центрирован- 
° 
ных значений случайной функции. Эти средние М |Y(t)| предста- 


вляют собой ошибку центрирования. Средний квадрат центриро- 
ванных значений случайной функции есть ее условная дисперсия. 
Извлекая корни квадратные, получим оценки условных стандарт- 
ных отклонений o[Y(t)] (табл. 4.11). 

Для вычисления корреляционной функции необходимо опреде- 
лить ковариации всех сочетаний по два из одиннадцати столб- 
цов табл. 4.11. Результаты образуют ковариационную матрицу — 
табл. 4.12, в которой по главной диагонали расположены условные 
дисперсии. Нормируя элементы ковариационной матрицы про- 
изведениями соответствующих пар стандартных отклонений из 
табл.4.11, получим матрицу коэффициентов корреляции (табл.4.13). 
Заметим, что по каждой диагонали этой матрицы, параллельной 
главной диагонали, расположены значения коэффициентов корре- 
ляции, относящиеся к одному и тому же значению сдвига т, но 
соответствующие разным началам отсчета. 
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Tabauya 4.11 
Центрированные реализации ошибки слежения 


0,25 [0,75] 1,25 2,25 | 2,75 | 3,25 | 3,75 4,75 
Ne 
1 -0,1] -0,1 | +0,1 
2 +1,0| -0,1 | -0,5 
3 +0,3 | +0,4 | +0,3 
4 —0,2 | -0,4 
5 —0,6 | 0,1 | +0,3 
6 -0,3 | -0,4 | -0,3 
Я 40,4 | -0,4 | +0,1 
8 —0,6 | 0,5 | +0,1 
9 —0,1 | +0,1 | -0,3 
10 -0,8 | -0,3 | +0,7 
и —0,1 | -0,4 | 0 
12 +0, | +0,9 | +0,9 
13 40,2| 0 |-0,2 
4 40,3 | +0,4 | -0,7 
15 40,7 | 40,8 | -0,1 
16 40,3 | +01 | 0 
7 —0,3 | -0,7 | +1,3 
18 -0,2 | -0,4 | 0 
19 -0,5 | -1,3 | -1,3 
20 -0,2 | -0,4 | -0,7 
21 —0,1 | +0,7 | +0,5 
22 —0,1 | +0,4 | -0,1 
23 +0,3 | +0,5 | -0,3 
M[Y (t)}}-0, 01] -0, 02 |+0,01|-0,04|-0,03. 
«[У(#] | 0,20 | 0,74 0,46 | 0,53 | 0,56 


Таблица 4.12 
Ковариационная матрица ошибки слежения 


1,25 3,25 | 3,75 
50,06; :0,001|-0,010|-0,032] 0, 
0,01 0,059 0,08: 
0, 30: 0,069 0, 05: 
0, 577 0, 149-0, 
0,035 0,02 
0, 119-0, 
0, 213-0, 02 
0,319-0, 05: 


0, 211 


По определению стационарности в широком смысле корреляци- 
онная функция не должна зависеть от начала отсчета. Это значит, 
что все коэффициенты корреляции, лежащие на одной диагонали, 
‘должны быть равны по величине. Из табл. 4.13 можно видеть, что 
величины и даже знаки коэффициентов одной и той же диагонали 
различны для всех диагоналей. Это свидетельствует о нестацио- 
нарности ошибки слежения. Аналогично M[Y(t)] и o[Y(¢)] в данном 
случае тоже нестационарны. 


Таблица 4.19 


_Матрица коэффициентов корреляции 
Ryy(r) значения оценок нормированной 
ворреляционной функции ошибок слежения 


Корреляционная функция нестационарной случайной функции 
должна быть задана совокупностью своих значений для всех начал 
отсчета т. Но для простоты аппроксимируем ее в рассматривае- 
мом примере стационарной корреляционной функцией, Стацио- 
нарную аппроксимацию ‘нормированной корреляционной функции 
Вуу(п) получим, усредняя коэффициенты по диагоналям и сопо- 
ставляя полученные средние значения координалам т: 


Kyy(t,t+7) 
oy(thoy(t+r)’ 
где к— количество усредняемых коэффициентов — убывает от 


одиннадцати (при 7, = 0 с) до одного (при 711 = 4,75 с). Так как при 
усреднении допускается некоторая ошибка, величина которой тем 


= ig 
Ryy(%) = py 
ist 
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больше, чем меньше k, точность оценки значений Куу(т) уменьша- 
ется с ростом т. В частности, значения Куу(т) при всех т > 1,75 с 
сомнительны. Однако для демонстрации проанализируем полу- 
ченную нормированную автокорреляционную функцию — рис. 4.7. 


175 225 275 325 375 


Puc. 4.7. Нормированная автокорреляционная функция стационарного 
процесса, вппроксимирующего ошибку слежения, к примеру 4-2. 
По оси ординат — функция Йуу(т), по оси абсцисс — сдвиг т, с. 


Можно видеть, что функция Куу(т) затухает, колеблясь вокруг 
горизонтали, параллельной оси т. Это обстоятельство всегда 
свидетельствует о наличии ошибок центрирования и вычислений 
(они, однако, не влияют на свойства полученной кривой). Пери- 
оды колебаний функции Вуу(т), судя по рис. 4.1, приблизительно 
равны 1 с. Это означает наличие периодической компоненты в 
ошибке слежения с основной частотой, равной приблизительно 1 
колебанию в секунду. Наконец, можно видеть, что при т ~ 0,5 с 
функция пересекает асимитоту, значит, интервал корреляции со- 
ставляет около 0,5 с. 


ГЛАВА ;. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ 
§.1, ЗАДАЧИ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ 


$11, Генеральная совокупность и выборка 


Из-за массовости случайных явлений, выступающих объектами 
научных исследований, приходится отличать то, что должно быть 
изучено, от того, что реально может быть изучено и изучается. 
Например, если должна быть изучена степень возможности по- 
явления некоторого случайного события, то необходимо рассмо- 
треть бесконечно большое число испытаний, в части которых мо- 
гло бы появиться это событие, и определить его вероятность. Это, 
однако, невозможно практически. Приходится ограничиваться ча- 
стостью как оценкой для вероятности, определяемой при некото- 
ром конечном числе испытаний. В этой связи в математической 
статистике выделяются два фундаментальных понятия: (генераль- 
ная) совокупность как то, что подлежит изучению, и выборка как 
то, что реально изучается. Очевидно, что выборка должна аде- 
кватно отображать генеральную совокупность, иначе результа- 
ты не совпадут с целями исследования. Тому, что это означает, в 
сущности и посвящена математическая статистика как наука. 

Совокупность и выборку можно рассмалриваль содержательно 
и формально по-разному, причем формальное рассмотрение важ- 
но с точки зрения применяемого описательного аппарата теории 
вероятностей, а содержательное — еще и с точки зрения органи- 
зации исследования. Поскольку понятие совокупности является 
исходным, начнем с него. 

Совокупностью будем называль практически счетное* множе- 
ство некоторых объектов (элементов), интересующих исследова- 
теля. Понятно, что, определяя объекты содержательно (психиче- 
ские свойства, состояния, процессы и т.д.) или формально (со- 
бытия, величины, функции и т.д.), мы так же определяем и всю 
совокупность. Свойством совокупности будем называть реаль- 


'Часто для удобствь в теории рассматривьются несчетные множества — 
например бесконечно большое число испытаний. 
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ное или воображаемое качество, присущее некоторым или всем ее 
элементам. Параметром совокупности будем называть свойство, 
которое можно квантифицировать в виде константы или перемен- 
ной величины. Свойства или параметры могут быть случайными 
и неслучайными. Соответственно совокупности рассматриваются 
как стохастические и детерминированные. 

Простой (одномерной) совокупностью назовем ту, которая ха- 
рактеризуется: 

— отдельным свойством (например, все негры США); 

— отдельным параметром в виде константы или переменной (на- 
пример, все петербуржцы среднего роста, или рост петербурж- 
цев); 

— системой непересекающихся (несовместных) свойств (напри- 
мер, все студенты и преподаватели СПБГУ). 

Сложной (многомерной) совокупностью назовем TY, которая ха- 
рактеризуется: 

— системой хотя бы частично пересекающихся свойств (напри- 
мер, студенты физического и психологического факультетов СПб- 
ГУ, мужского и женского пола, окончившие школу с отличием); 

— системой параметров: независимых, частично зависимых и 
зависимых в совокупности (примером может служить система па- 
раметров, изучаемая в комплексном исследовании личности*). 

Гомогенной (однородной) назовем совокупность, все характери- 
стики которой присущи каждому ее элементу, т.е. распределены 
по всей совокупности одинаковым образом. 

Гетерозенной (неоднородной) назовем совокупность, характери- 
стики которой сосредоточены в отдельных подмножествах элемен- 
тов, так что гетерогенную совокупность можно рассматривать как 
объединение гомогенных подсовокупностей. 

Все стохастические простые и сложные совокупности могут 
быть гомогенными; гетерогенными — чаще всего сложные. 

Неполная классификация совокупностей в пояснение изложен- 
ной систематики приведена на рис. 5.1. Можно полагать, что для 
психологической теории и практики наибольший интерес предста- 
вляют стохастические гетерогенные многомерные совокупности, 
характеризуемые системой (или даже системами) параметров и 
свойств. 

Параметром, важнейшим с точки зрения возможностей иссле- 
дования, является обвем совокупности — количество образующих 
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Рис. 5.1. Классификация генеральных совокупностей. 


ее элементов. Величина объема часто зависит от того, как опре- 
делена сама совокупность. Мы уже встречались с этим вопросом 
в главе 1, рассматривая число исходов опыта и полную группу 
событий. Действительно, если, например, нас интересует эмо- 
циональное состояние конкретного студента 1-го курса в период 
сдачи конкретного зачета в зимнюю сессию, то генеральная сово- 
купность исчерпывается дискретным числом оценок эмоциональ- 
ного состояния данного студента, полученных в течение получаса. 
Иной объем будет иметь совокупность эмоциональных состояний 
всех студентов первого курса, еще больший — совокупность для 
студентов всех первых курсов данного вуза, еще больший — при 
Условии нескольких зачетов и экзаменов и т.д. Если совокуп- 


ность из одного студента можно изучить с рассматриваемой точ- 
ки зрения досконально, то совокупность из студентов всех первых 
курсов, не ограничивая годы изучения, исследоваль уже не пред- 
ставляется возможным. Понятно, что общая, дифференциальная 
и социальная психология по сравнению с другими психологиче- 
скими отраслями преимущественно имеют дело с совокупностями 
очень большого, хотя и конечного объема, идследовать которые 
‘иначе, чем выборочным путем, нельзя. 

Выборкой будем называть некоторую часть генеральной сово- 
купности. Принято классифицировать выборки по репрезентатив- 
ности, по объему, по способу отбора и по схеме испытаний. Репре- 
зентативной (представительной) называется выборка, адекватно 
отображающая генеральную совокупность в качественном и коли- 
чественном отношениях. Что это конкретно означает, можно бу- 
дет объяснить лишь в дальнейшем изложении. Однако заметим, 
что репрезентативность выборки непосредственно зависит от ее 
объема. Априори ясно: чем ближе объем выборки к объему со- 
вокупности, тем репрезентативнее выборка. Способы отбора и 
схемы испытаний, в сущности, лишь обусловливают возможность 
получить репрезентативную выборку при ограниченном объеме. 

По способу отбора выделяют случайную и неслучайную выбор- 
ки. Выборка называется случайной, если элементы генеральной 
совокупности отбираются случайным образом. Под этим обыч- 
но понимают равные шансы для каждого элемента быть выбран- 
ным. Альтернативой случайной выборки является выборка, отбор 
в которую тенденциозен. Так как большинство методов математи- 
ческой статистики основывается на понятии случайной выборки, 
остановимся на нем подробнее. 

Рассматривая нормальное распределение, мы отмечали, что 
случайная величина имеет нормальное распределение при усло- 
вии, что на нее действует большое число случайных факторов, 
равных по силе воздействия. Мы также указывали, что при п > 20 
ир= 4 биномиальное распределение практически не отличается 
от нормального. Тот факт, что композиция нормально распреде- 
ленных аргументов имеет нормальное распределение, может быть 
обобщен и на композиции распределений аргументов, отличных 
от нормального, при условии большого числа равнодействующих 
случайных аргументов. Указанные обстоятельства и составля- 
ют существо так называемого закона больших чисел, на котором 
основываются все представления об ошибках оценивания свойств 
и параметров генеральной совокупности по выборке. В этой свя- 
зи, очевидно, выборка должна быть случайной уже потому, что 
иначе нельзя правильно использовать разработанные в теории ма- 
тематической статистики приемы и методы оценивания. С другой 


стороны, выборка должна быть случайной для того, чтобы предна- 
меренно или нечаянно не исказить «истинных» характеристик ге- 
неральной совокупности тенденциозным отбором элементов в вы- 
Gopxy. 

Считается, что любые неравные шансы для элементов попасть 
в выборку приводят к тенденциозному, неслучайному отбору. Су- 
ществует немало мутодов организации случайного отбора. Не 
разбирая их подробно, укажем на основной — это произвольная 
нумерация элементов из генеральной совокупности, а затем вы- 
бор по таблицам равновероятных случайных чисел. 

Заметим, что в психологических исследованиях редко заботят- 
ся о случайном отборе испытуемых, хотя внешние стимульные воз- 
действия организуются в случайном порядке. Понятно, что из- 
за этого полученные экспериментальные оценки изучаемых явле- 
ний менее адекватны популяции homo sapiens, чем при случайной 
выборке испытуемых. Поясним сказанное следующим образом, 
Пусть изучение некоторой психической переменной осуществляет- 
ся на группе испытуемых-студентов. Даже если эта группа пред- 
ставляет собой случайную выборку из совокупности студентов 
данного вуза, она является не случайной, а тенденциозной (на- 
пример, относительно всех жителей данного города, имеющих тот 
же возраст) уже потому, что на психические переменные не может 
не влиять уровень образования, а студенты — люди достаточно 
высокообразованные. Поэтому данные, полученные на студентах, 
строго говоря, справедливы лишь для студентов. Эти очевидные 
вещи приводят к нетривиальному для математической статистики 
выводу: случайная выборка, как она обычно понимается, приме- 
нима безоговорочно лишь для гомогенных совокупностей. Как же 
изучать выборочным путем гетерогенные совокупности? 

Очевидна необходимость репрезентативно отобразить в выбор- 
ке структурные (качественные и количественные) характеристики 
гетерогенной совокупности. Столь же очевидно, что этого мож- 
но достичь средствами случайного отбора лишь при условии, что 
объем случайной выборки приближается к объему генеральной 
совокупности. Поскольку выборка такого объема столь же нере- 
альна, как и изучение всей генеральной совокупности, возника- 
ет парадоксальная необходимость использовать неслучайную вы- 
борку. 

Неслучайный отбор может быть механическим, типическим, се- 
рийным и комбинированным. Все эти виды, в сущности, сочетают 
тенденциозный и случайный отбор. 

При меганическом отборе вся совокупность делится на столь- 
ко частей, сколько единиц планируется в объеме выборки, после 
чего случайным образом из каждой части отбирается один эле- 
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мент, включаемый в выборку. При типическом отборе совокуп- 
ность делится на гомогенные части, после чего из каждой части 
осуществляется случайная выборка. При серийном отборе гене- 
ральную совокупность делят на большое число равновеликих се- 
рий, после чего случайную выборку делают не из единиц, а из 
серий совокупности, причем серии, попавшие в выборку, изучают- 
ся сплошь. При комбинированном отборе сочетаются на разных 
этапах уже рассмотренные виды отбора. Одной из разновидно- 
стей комбинированного отбора является двухступенчатый отбор, 
при котором на первой ступени осуществляется серийный отбор, 
а на второй — из каждой серии, попавшей в случайную выборку 
серий, выполняется случайная выборка элементов. Лругая раз- 
новидность комбинированного отбора состоит в следующем. При 
отсутствии достоверной априорной информации любая совокуп- 
ность считается гомогенной и из нее на первом этапе случайным 
образом делается выборка большого объема, по которой апосте- 
риори выявляется гетерогенный характер совокупности и опреде- 
ляется многомерное распределение вероятностей ее гомогенных 
частей. На втором этапе, уже на основе апостериорной информа- 
ции о типических характеристиках совокупности, осуществляется 
типический отбор, и в результате нового выборочного исследо- 
вания уточняются сведения о генеральной совокупности. Лалее 
могут следовать третий и другие этапы с повторными уточняю- 
щими типическими выборками. 

По схеме испытаний выборки делятся на независимые (повтор- 
ные, простые) и зависимые (бесповторные, сложные). Суть этого 
разделения в том, чтобы вероятностные характеристики генераль- 
ной совокупности не изменялись под бесцеремонными воздействи- 
ями исследователя. Простая выборка образуется по схеме незави- 
симых испытаний, т.е. элементы, вошедшие в выборку, возвраща- 
ются обратно в генеральную совокупность, благодаря чему без- 
‘условная вероятность каждого элемента быть избранным не меня- 
ется в процессе отбора. При бесповторной выборке элементы, од- 
нажды выбранные, уже не могут выбираться снова: они исключа- 
ются. Таким путем по ходу отбора объем совокупности уменьша- 
ется, и состав ее изменяется, так что условные вероятности быть 
выбранными для оставшихся элементов все время увеличиваются. 
В свою очередь это означает, что элементы выборки оказывают- 
ся зависимыми, причем эта фиктивная зависимость должна быть 
учтена, иначе ее можно ошибочно приписать самой генеральной 
совокупности. Понятно, что чем больше объем исходной сово- 
купности, тем меньше различия между простой и бесповторной 
выборками. 

По объему принято выделять малые и большие выборки. Малы- 


ми считают выборки, объем которых п < 30. Понятие большой вы- 
борки не определено. Рассматривая массивы данных, полученных 
при изучении двумерной системы, мы выделили три класса объ- 
емов выборок, основываясь на возможности. сгруппировать дан- 
ные и оценить распределения величин в системе, а также опре- 
делить значения всех или только некоторых числовых характери- 
стик. При таком практически полезном подходе малая выборка 
имеет объем п < 30, средняя 30 < п < 200 и большая п > 200. 
Конечно, это деление весьма условно. Наивно было бы судить 
о неизвестных свойствах совокупности по выборке малого объ- 
ема. Поэтому малые выборки используются при статистическом 
контроле известных свойств изученных совокупностей. Большие 
выборки, наоборот, используются как раз для установления не- 
известных свойств и параметров совокупности. Однако, чтб счи- 
тать здесь большим, зависит от этих свойств и параметров. Во 
избежание порочного круга вводится понятие хритического обзема 
выборки, которое мы рассмотрим дальше. 

Приведенная типология не исчерпывает разнообразия выборок. 
Так, по масштабам охвата исследуемых людей в нашей стране це- 
лЛесообразно выделять национальную, региональные, городские, 
районные выборки, а также выборки для психологического изуче- 
ния различных социальных общностей, в том числе — выборки Ha 
предприятиях, в учреждениях и организациях. Национальная вы- 
борка применяется для стандартизации и адаптации зарубежных 
тестов как стандартных средств психологических измерений. Лля 
этой цели можно использоваль и выборки меньших масштабов, 
адаптируя психодиагностическую методику в рамках отрасли или 
даже отдельного предприятия. При этом полученные нормативы 
следует использовать повсеместно, как того требует наука об из- 
мерениях. 

По длительности периода использования выделяются кратко- 
срочные выборки, которые применяются в большинстве традици- 
онных научных исследований, и долгосрочные выборки — так на- 
зываемые панели, которые применяются для изучения обществен- 
ных мнений, мотивов, предпочтений и прочих массовых психиче- 
ских явлений в экономической, политической, социальной и дру- 
гих отраслях психологии, Особенностью панели служит обес- 
печение инвариантности качественно-количественной структуры, 
репрезентативной в отнощении той социальной общности, феноме- 
ны которой подлежат текущему контролю, в условиях естествен- 
ной динамики людей, образующих панель. Обеспечение ‘инвари- 
антности достигается путем создания специального выборочного 
резерва, из которого замещаются выбывающие по каким-либо при- 
чинам люди. Таким образом панель сохраняет гомогенность при 


многочисленных периодически повторяющихся обследованиях. 
По количеству использований выделяются однократные и мно- 
гократные (серийные) выборки. Как правило, прав вы 
борки создаются и применяются с ограниченной целью разв im 4 
т.е., как говорят социологи, в пилотажных исследованиях. Лля 
установления научных фактов необходимо воспроизводить эмпи- 
рические результаты в стационарных условиях, а для Saas 
научных законов нужно измерять характерные изменения Pesy. ea 
татов при целенаправленном варьировании условий, Е котор! е 
эти результаты могут зависеть. В обоих случаях требуются то 
вторные, иногда многосерийные выборки, причем гомогенные 
стохастической структуре от серии к серии. В отличие от панели 
такие выборки состоят из переменного состава людей, но с одина- 
ковыми наборами свойств в различных сериях. Это снижает воз- 
можный «консерватизм» панели и увеличивает статистику, bo 
нужную при выборочном изучении человеческих совокупносте 


} 1.1. Количественные характеристики генеральной совокупности и выборки 
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Назначение выборки исчерпывается получением сведений о ге- 
неральной совокупности. Поэтому совокупность и выборка долж- 
ны содержательно и формально характеризоваться на качествен- 
ном уровне одними и теми же свойствами, параметрами и их си- 
стемами, а на количественном уровне — одними и теми же число- 
выми и функциональными мерами. В этой связи можно подве- 
сти итоги основным средствам формального описания случайных 
явлений, рассмотренным в предыдущих главах, разделяя все коли- 
чественные характеристики совокупностей и выборок на две груп- 
пы: параметрические (числовые) и непараметрические (функцио- 
нальные), а затем классифицируя их, как показано на рис. 5.2. и 
5.3. 

С формальной точки зрения различия между выборкой и гене- 
ральной совокупностью могут состоять в следующем. 

1.Выборка как система. с меньшим числом описывающих фак- 
торов (событий, величин, функций), чем генеральная совокуп- 
ность, — такая выборка часто нерепрезентативна (или малорепре- 
зентативна). 

2. Функциональные характеристики выборки отличаются от со- 
ответствующих характеристик генеральной совокупности. В за- 
висимости от степени (приемлемости) отличий оценивается репре- 
зенталивность выборки. 

3. Параметры выборки отличаются от параметров генеральной 
совокупности, причем степень отличия (приемлемая или нет) вы- 


стандартные 
Dov 


Классификация параметрических характеристик совокупностей и выборок 


Непараметрические 
foynruuonasrenvre) 


безуслов- 
ные, 

coomecm 
‘ные, 

условные 


Puc. 5.5. Классификация непараметрических характеристик 
совокупностей и выборок. 


ражает репрезентативность выборки. Так как многие функцио- 
нальные характеристики могут быть определены через параме- 
тры, оценивание параметров генеральной совокупности посред- 
ством параметров выборки наиболее распространено. 

Нетрудно понять, что все указанные различия в конечном счете 
по степени находятся в обратной зависимости от объема выборки. 
Действительно, на рис 1.1 было показано, как изменяются средние 
значения частости появления цифры «7» от выборки к выборке 
(объемом п = 50). На рис. 1.2 можно видеть, что размах, харак- 
теризующий рассеивание выборочных средних, уменьшается при 
увеличении п, В общем случае при небольших п от выборки к вы- 
борке меняется и форма распределения случайных переменных. 
Так что, например, из нормально распределенной совокупности 
можно при малом п получить выборочные распределения любой 
произвольной формы. 

Обращаясь еще раз к определению частости как отношению ча- 
стоты (/) к числу наблюдений (п), подчеркнем ее смысл. Частость 
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означает, что событие (число) в массе серий (выборок) по п ис- 
пытаний в среднем встречается f раз. Это, следовательно, не ис- 
ключает того, что оно вообще не встретится или встретится все 
п раз: 0 < f < п, как следует из определения частости и бино- 
миального закона распределения. Но тогда очевидно, что редкие 
события можно наблюдать при большом п, так как они лишь слу- 
чайно могут появиться в выборке с малым п. Наоборот, в малой 
выборке преимущественно появляются частые события. 

Теперь представим себе, что объем генеральной совокупности 
N позволяет сделать большое число (Е) случайных выборок ма- 
лого объема п; (М > пы: = 1,2,...,R). Будем «вычерпывать» 
объем № выборками объема nj, тогда при зависимых испытани- 
ях М = ой п;. Если допустить, что изучаемый параметр в ге- 
неральной совокупности распределен нормально, то при условии 
случайного отбора очевидно, что с вероятностью 0, 683 пример- 
но две трети всех выборок охватят лишь значения неизвестного 
параметра 9 в пределах 6 + 0», и лишь 0, 046 всех выборок охва- 
TAT значения параметра в пределах @ < —20% и > 20. Отсю- 
да следует практически важный вывод. Функции распределения 
случайных величин в генеральной совокупности можно оценивать 
разными путями: 1) обобщением многих случайных выборок не- 
большого объема, а потому в отдельности нерепрезентативных; 
2) отображением с помощью одной большой случайной выборки, 
объем которой с классических позиций (см. $ 5.3) достаточен для 
репрезентативности; 3) моделированием по результатам специаль- 
ных социолого-психологических исследований, по данным пере- 
писей либо анкетным данным в службах кадров организаций и 
предприятий. Первый путь не гарантирует научно обоснованной 
репрезентативности результата, второй — связан с весьма значи- 
тельным числом необходимых наблюдений, а значит, с большой 
потребностью в ресурсах. Третий путь заменяет проблему ре- 
презентативности проблемой адекватности модели генеральной 
совокупности. Но именно третий путь представляется перспек- 
тивным для психологической практики. 

Суть моделирования генеральной совокупности сводится к сле- 
дующему. Сначала выбираются свойства, существенные для це- 
лей исследования, и признаки либо градации этих свойств, кото- 
рые принимаются за базис модели. Затем из теоретических со- 
ображений (равномерное, нормальное распределение) либо эмпи- 
рически — по данным переписей, социологических обследований, 
анкетным сведениям и даже по результатам оценок, полученных 
по первому или второму из вышеназванных путей, определяется 
дифференциальная функция распределения частостей в полном со- 
вмещенном распределении либо в частных распределениях, сово- 


купность которых необходима и достаточна для восстановления 
полного распределения по уравнениям типа (1.27) и (4.5). 

Например, в параграфе 1.3 была рассмотрена трехмерная си- 
стема событий, полезная для диагностических целей: {IT SUH} = 
{(м,ж) - (2, и)(н,н)}, где &С = (м,ж) — мужской или женский пол, 
84 = (э, и) — экстраверсия—интроверсия, # = (, н) — отсутствие 
или наличие выраженного нейротизма (по Г. Айзенку) у обследуе- 
мых людей. Для этой системы базис модели образуется декарто- 
вым произведением выделенных градаций: {I SUH}=(meH, мен, 
MMH, мин, жай, жэн, жин, жин). Tak как нам уже известно, что эти 
совмещенные события неравновозможны, то пользоваться равно- 
мерными распределениями нельзя и, как можно думать, считать 
компоненты системы независимыми некорректно. Поэтому целе- 
сообразно воспользоваться восстановлением полного распределе- 
ния модели по частным распределениям, которые необходимы и 
достаточны по (1.27) для этой цели. Так, 


HK) о (94/5) о HHH 3%) = HI IU), 


Ради примера зададимся правдоподобными данными и вычислим 
по ним распределение частостей модели: 


ев 
м [0,2 0,8 
2) = (15). М (=). 


2H эн ин ин 


м (0,9 0,1 } 0,7 0,3 
P(H/H -8U) = ( ) 


ж \ 0,8 0,2 | 06 04 
PAK IUH) = 
2 и эн эн 
м ыы м [0,2 08\ м [0,9 01 
= Е в екон 
ж \ 06) x lor 0,9] ж\0,8 02 
эн эн ии 


_м (0,4-0,2-0,9 04.0,2-01 0,4-0,8-0,7 
ж \0,6-0,1-0,8 0,6.0,1.0,2 0,6.0,9-0,6 
эн эн ин ин 


_ м (0,072 0,008 0,224 0,096 
ж \ 0,048 0,012 0,324 0,216)” 


dina проверки расчета суммируем столбцы полученной матрицы 
и установим распределение по полу: 


= _ м [0,4 

aa) = Par oun =" (3) 
He 

Таким образом, расчет верен. 


$1]. Погрешности статистических оценок 
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Параметрические характеристики выборки принято называть 
оценками в отличие от параметрических характеристик совокуп- 
ности, которые называются параметрами. Таким образом, сред- 
нее арифметическое значение выборки есть оценка. среднего ариф- 
метического значения генеральной совокупности; частость (эмпи- 
рическая вероятность) — это оценка вероятности, и т.д. Понятно, 
что величина оценки может отличаться от величины параметра. 
во всех случаях, если объем выборки меньше объема, совокупно- 
сти. При этом в силу случайности отбора элементов в выбор- 
ку любая оценка является случайной величиной. Действитель- 
но, пусть имеется большое число А выборок фиксированного объ- 
ema п; (i = 12,...,В), в каждой из которых определена оценка 
t; некоторого параметра @ генеральной совокупности. Флуктуи- 
руя от выборки к выборке, значения & распределяются в некото- 
рой области возможных значений tmin < 9 < tmax с вероятностями 
P(0 < t;), совокупность которых образует функцию распределения 
F(t) произвольного вида. Если 9 — величина непрерывная, то су- 
ществует и плотность вероятности f(t) = + P(t < < ti +), где 
P(ti <0 <&+)) — вероятности параметру 9 быть оцененным по 
выборке значениями t; на интервале квантования. At. Таким обра- 
зом, оценка t; некоторого параметра 0 является «полноправной» 
случайной величиной и описывается уже рассмотренным аппара- 
том качественных свойств и количественных характеристик. 

„Для распределений оценок принято учитывать свойства поло- 
жения, рассеивания, асимметрии, а также связи (в случае выборки 
по схеме зависимых испытаний). При этом используются соответ- 
ствующие меры; в частности, среднее арифметическое значение 
оценки как мера ее положения, дисперсия и стандартное откло- 
нение оценки как меры ее рассеивания. С учетом этих свойств 
распределения выборочной оценки обычно определяют два вида 
оценивания: точечное и интервальное (доверительное). 

Точечное оценивание основывается Ha ‘учете положения, рассе- 
ивания, а также асимметрии распределения оценки. Мерой здесь 
служит математическое ожидание параметра @, определяемое 
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для конечных по объему совокупностей как среднее арифметиче- 
ское из оценок &: М[®] = Dia, iP (ti < 9 < ti + №), a для R— 00: 
м] = Jr" tf(t)dt. Таким образом, матемалическое ожидание па- 
раметра есть среднее арифметическое из оценок, которые, в свою 
очередь, являются выборочными средними из значений параме- 
тра, т.е. это среднее из средних. 

В предыдущих главах мы рассматривали значительное число 
разных мер положения, рассеивания и т. д- (см. рис.5.2). Какие 
же из этих мер более всего подходят для оценки соответствующих 
параметров совокупности? Выбор оценки должен основываться 
на критериях, предложенных Р.А. Фишером, с позиции которых 
оценкам приписываются свойства состоятельности, эффективно- 
сти, несмещенности и достаточности. 

Оценка { является состоятельной (или подходящей) для пара- 
метра 6, если limant = 0, где п— объем выборки, а М — объем 
совокупности. Иначе говоря, при п — N вероятность разности 
1-9 стремится к нулю, если {— состоятельная оценка 0. Рас- 
смотренные нами оценки в своем большинстве являются состоя- 
тельными. Поэтому чтобы выбрать из них наилучшую, учитыва- 
ют дисперсию D(t). Эффективной называется оценка, у которой 
наименьшая дисперсия. Степень эффективности оценивают дис- 
персионным отношением: F = De(t) : Du(t), где Ов(1) — ббльшая 
и О, (2) — меньшая по величине дисперсии оценки. Чем больше 
отличается F от единицы, тем эффективнее оценка {, имеющая 
меньшую дисперсию Dy(t)*. Оценка должна быть несмещенной. 
Это означает, что M[t] = 6, т.е. математическое ожидание выбо- 
рочной оценки равно значению параметра в генеральной совокуп- 
ности. Здесь отметим, что несмещенность оценок обеспечивает- 
ся, во-первых, симметричностью их распределений, а во-вторых, 
случайным отбором. Оценка, наконец, должна быть достаточной 
в том смысле, что никакая другая оценка не дает дополнительной 
информации об изучаемом параметре. 

Представление об указанных свойствах для некоторых мер (из 
числа рассмотренных нами) при их использовании в качестве оце- 
нок можно получить из табл. 5.1. В этой связи принято считать, 
что наилучшей (в смысле удовлетворения критериям) оценкой по- 
ложения является среднее арифметическое. Оценки рассеивания 
и связи уже удовлетворяют лишь части критериев. Несмещен- 
ной оценкой дисперсии генеральной совокупности служит вели- 
чина 3? = =2;D, где з— оценка стандартного отклонения, D— 


выборочная дисперсия, п— объем выборки. Заметим, что 5? не 


"Более подробно дисперсионное отношение Р будет рассмотрено в парь- 
графе 5.2. 


Таблица 5.1 


Оценка Состоя- | Эффек- | Несме- | Доста- 
тельная | тивная | щенная | точная 
Частость (р) Да Да Да Да 
Мода (Mo) Да Нет Да Нет 
Медиана (Ме) Да Нет Да Нет 
Среднее 
арифметическое(М) Да Да Да Да 
Дисперсия (D)....... Да Да Нет Да 
Стандартное 
отклонение (в)........... Да Дь Нет Да 
Коэффициент. 
сопряженности 
Чупрова (К).............| Да Да Да Ла 
Коэффициент 
корреляции ‘ 
Bpase — Пирсона (rj)...| Да pity Her Her 


является выборочной дисперсией. Это просто случайная вели- 
чина, служащая несмещенной оценкой генеральной дисперсии, но 
смещающая выборочную дисперсию на величину п : (п-1). Легко 
понять, что с увеличением п отношение п : (п — 1) быстро сходит- 
ся к единице и 5? сходится ка? = О. Наиболее распространенная 
линейная мера корреляции — коэффициент Бравэ — Пирсона, ry 
является смещенной оценкой, причем смещение увеличивается с 
увеличением модуля значения |r,;|, как видно из рис. 5.4. В этой 
связи в качестве несмещенной оценки используется предложенное 
Фишером 2-преобразование: 


Определить 2; для г;; можно по табл. Ш Приложения 2. 

Jina построения оценок, удовлетворяющих указанным выше 
критериям, Фишер разработал статистический метод точечного 
оценивания — метод максимального правдоподобия, который мы 
рассмотрим в $ 5.3. 

Интервальное (доверительное) оценивание базируется на учете 
рассеивания, преимущественно симметричного. Существо этого 
способа оценивания состоит в том, чтобы указаль доверительный 
интервал: 


ti —tao(8) < < +1.0(8), (5.1) 


в котором 9 — значение искомого параметра — заключено с дове- 
рительной вероятностью 1 — а, если 0(6) — стандартное отклоне- 
ние параметра, и ta — квантиль распределения параметра, отсека- 
ющий слева и справа долю вероятности, равную а. Обычно при- 
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Puc. 5.4. Распределение выборочной оценки коэффициента линей- 
ной корреляции (7). 

По оси ординат — объем выборок (п = 12), по оси абсцисс — выбо- 
`рочная оценка коэффициента. 1-7 = 7 =0,4;3-7 =0,8. 


-7 


нимают а = 0,05, 0,01, реже— а = 0,1 и 0,001. Смысл интервально- 
го оценивания параметра (на примере арифметического среднего) 
поясняется на рис. 5.5. 

На основе интервальных оценок параметров, образующих функ- 
цию распределения, осуществляется оценивание доверительной 
области. Наиболее распространено построение доверительной 
области для простой регрессии (рис. 5.10), что будет рассмотрено 
ниже. 

Для получения интервальных оценок необходимо уметь вычи- 
слять а(9) — стандартные отклонения параметров, которые при- 
нято называть стандартными ошибками (погрешностями) выбо- 
рочных оценок параметров. Определение этих ошибок зависит 
от многих факторов, но прежде всего от объема выборки. Сводка 
формул для оценки стандартных погрешностей многих параметри- 
ческих характеристик представлена в табл. 5.2. Там же даны соот- 
ветствующие разъяснения. Дополнительно заметим, что, строго 
говоря, применение стандартных погрешностей правомерно лишь 
тогда, когда распределение статистик сходится к нормальному за- 
кону. Но это выполняется для разных статистик с различной ско- 
ростью. 

„Для психодиагностических методик важное значение имеет точ- 
ность результата измерения, зависящая от конструкции методики 
как инструмента измерения. Оценивается эта точность с помо- 
ЩЬЮ так называемой инструментальной погрешности. Она пред- 
ставляет собой стандартное отклонение результата измерения как 
выборочного среднего от среднего в совокупности и определяет- 


t(x) 


Puc. 5.5. Интервальное оценивание параметра. 
«— плотность выборочного распределения оценок |; параметра 9 в 
стандартном масштабе: t = (t;—@) : (8), где o(9) = /Б(Х):т (D(X) — 
выборочная дисперсия, п— объем выборки), 1 - «— доверительная 
вероятность, to.sq — квантили распределения Стьюдента, 9 — матема- 
тическое ожидьние параметра в совокупности; 6— плотность pacnpe- 
деления изучаемой случайной величины X, параметр которой оцени- 
вается (в данном случае то среднее арифметическое значение), d(t) — 
доверительный интервал в стандартном масштабе: d(t) = 1; + tao(8). 


ся из отношения остаточной дисперсии методики (теста) к объему 
той выборки, на которой была стандартизована либо адаптирова- 


на методика: 
е=\/Пь:п. 


Здесь с — инструментальная погрешность теста, Do — остаточная 

дисперсия, которая определяется в общем случае формулами (3.13), 
а применительно к линейной функции от случайных аргументов 

X; (см. раздел 4.2.2) как результат по субтестам теста (блокам 

анкеты и т.п.) — суммой ковариаций из ковариационной матрицы 

теста, взвешенных произведениями коэффициентов регрессии: 


мм 
Da(¥) = У a:a;COV;;, 


1j=1 


Таблица 5.2 


Стандартные погрешности статистического оценивания параметров 


п— везде объем выборки 


Оценивыемый парьметр 


Формулы стандьртной погрешности | Обоз ‚ня и условия применимости 


Вероятность события (значения 
величины): Р(А); Р(А/В); 
P(X ==); Р(Х < =) 


Плотность вероятности f(x) 


Медиана Ме 


Квартиль 0; (i= 1, 3) 


Начальный Moment К-Й сте- 
пени ть 


Для параметров возможности 


yiea-P), 
Viet - Fe) 


re 
а = [2s 


Для параметров положения 


o(P)= 


ac 


o(Me) = 


99.) = 


Для вероятностей событий, 


‚для функций распределения 


Для плотностей распределения 


ую — ординать плотности, соответ- 


ствующыя медиане, 


© — стандартное отклонение нор- 


мально распределенной гене- 
ральной совокупности 


То же 


В любых условиях 


Продолжение табл. 5.2 


Оцениваемый параметр 


Формулы стандартной погрешности 


| Обозначения и условия применимости. 


ft 


Среднее арифметическое 
значение M(X) 


Разность двух средних 
арифметических зна- ° 
чений М(Х:) и M(X2) 


o[M(X)] = 


[22 ) Xa) 
п 


з(М(Х,) - М(Х: |} = 


{IM(X1) - M(X2)| 


To we 


ила: — M(X1)}? + 72 


-/2 MO? mtn 
м2 -2 п 
Для параметров рассеивания 
Размах распределения 4 o(d) = Е ее 4 Tg 
Сумма абсолютных 
отклонений = 
n o(ndz) = ee 
noe = > lei -М(Х)| n(n — 1) 
mi 


Среднее арифметическое 
отклонение 5. 
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об) = o(2)y/= (1-2 


<(Х] — стандартное отклонение 
в генеральной совокуп- 
ности. Если оно неизвестно, 
то заменяется выборочной 
оценкой 5(Х) 


п; — для выборки X; и 
па — для выборки Хз; 
a(Xy) и (Хз) — «генеральные» 
стандартные отклонения 


Еели o(X) и o(X2) неизвестны 


Без ограничений 


* 23,14; о(пб,) — так называ- 
емый коэффициент Питера 


Для нормального распре- 
деления с «генеральным» 
стандартом o(2) 


Продолжение табл. 5.2 


Оцениввемый пераметр_ 


Формулы стандартной погрешности. 


Обозначения и условия применимости 


Дисперсия D 


Стандартное отклонение o(X) 


Разность двух выборочных 
дисперсий |5} — 83| 


Коэффициент вариации Пир- 
coma У (в %) 


Для параметров 


Коеффициент асимметрии Аз 


Коеффициент эксцесса Ex 


(У) =У x р + (5) | 


асимметрии и 


_ Г 6-0 Г 5 
HA) = ии + Vanes 


Для любого распределения, 
для нормального распределения 


В любом случае, 
приближенно — в случае асимито- 
тически нормального распределе- 
ния, точно — для нормального 
распределения 


Jina зависимых выборок равного. 
объема, 
для независимых выборок равного 


объема, 
для независимых выборок неравных 


объемов ny и ng 


Для асимптотически нормального 
распределения 


эксцесса 


Приближение допустимо при боль- 
ших я 


To же 


= 24" ("- 2)®-3) [34 
НЫ у "10 +3)(+5) ^ Vines 


Продолженме табл. 5.2 


Оцениваемый параметр 


Формулы стандартной погрешности [Обозначения и условия применимости 


Ковффициент ранговой корреля- 


ции Кендалла т 


Коэффициент ранговой корреля- 


ции Спирмена р 


Коэффициент детерминации 72), 


Коеффициент линейной корреля- 


ции Браво —Пирсона ri 
2 -преобразование Фишера. 
для тв; 


Разность 2- преобразований 
[а — 22] 


Для параметров связи 
1 /4n+10 
or) = 5 fe 
(в) = 


(=) 


olla — 221) = 


В предположении, что ранжирована 
непрерывная переменикя 


и— функция, 2 — аргумент, М— 
число рассматриваемых значе- 
ний м, из которых вычислен 72), 


Формула Пирсона — Филоно для вы- 
Gopox n > 500, 
прип> 100, 
при п < 100 


Для любых условий 


При отсутствии (или неучете) 
частных корреляций первого 
и болсе высоких порядков 


Продолжение табл. 5.2 


Оцениваемый параметр. 


Формулы стандартной погрешности 


[Обозначения и условия применимости 


Степень линейности простой 
агрессии, определяемая 
размостью 1, — т, 


Угловой коэффициент 
простой линейной 
регрессии а: 


Свободный член простой 
линейной регрессии авы 


Коеффициент множественной! 
‘нелинейной детерминации 


mhas...N 
Коэффициент множественной 


корреляции R225. 


Ковффициент частной 
корреляции 7]; 3..м 


Коеффициент множеств 
линейной регрессии fy 


ote) 


(2) 


[us — M(u))? 


ит 
1 Mee 


2? Do - Mer 


п-т) 


В зависимости от объема выборки, 
в зависимости от числа N 
рассматриваемых 
значений и 


При малых п < 100, 
при бёльших (п > 100) выборках 


| № — число величин в системе 
То же 


При Малых п < 100, 
при бфльших (п > 100) выборках 


Окомчание табл. 5,2 


Оцениваемый параметр 


Обозначения и условия применимости 


Парциальный кооффициент мио- 
жественной линейной регрес- 
сии ayy 

Разность двух коэффициентов 
множественной детерминации 
Ат. 


Для величи 


Теоретическое значение услов- 
ного среднего м” в простой 
регрессии 


To же в линейной множествен- 
ной регрессии 


м 
саж 
‘ 


То же в множественной perpec- 
сии произвольной формы 
м" = W(X1,X2...Xw) 
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Формулы стандартной погрешности. 


ofa, 


14751 


а(Ат;) = м 


ны функционально 


12. _мио)за. м опреде- 

ляются из формулы (4.11) 

Ants = а. м, — аз. м, 
гле № им № — число случайных 
аргументов. Справедливо и для 
линейной регрессии. 


характеризуемого параметра 


Для регрессии u = v(2) любой 
формы; а(и) — стандартное откло- 
исние в совокупности — можно за- 
менить выборочной оценкой з(и), 
hye — ковффициент детерминации 


В общем случае, 
при независимых слагаемых 


2% aw 


= СОУ(А,Х,) 


и У — частные производ- 
эх, "эх, on 

ные функции dno гму и j-My 
аргументам соответственно 


где 
N 
Y= oaXitd, 


N—uncao, i,j Е №— номера <убтестов, X — шкальные оценки по 
субтестам, аи b— коэффициенты регрессии. 

К сожалению, в руководствах по тестам оценка инструменталь- 
ных погрешностей не приводится и отсутствуют ковариационные 
матрицы, так что их приходится вычислять по корреляционным 
малрицам. В результате качество многих распространенных Te 
стов как средств психологического измерения остается неопре- 
деленным, а достоверность результатов тестирования зачастую 
вызывает сомнения даже у малосведущих в метрологии психоло- 
гов. Однако качество тщательно отработанного эмпирически и 
стандартизованного в национальном масштабе теста может быть 
весьма высоким. Так, известный тест Векслера для диагностики 
уровня интеллекта взрослых людей (тип WAIS) имеет, по нашим 
подсчетам, инструментальную погрешность порядка 0,5 едини- 
цы JQ (при доверительной вероятности 0,999) и, таким образом, 
является первоклассным измерительным прибором. 


5.1.4. Надежность статистических оценок 


В отличие от обычного предположения научная гипотеза явля- 
ется предположением, допускающим практическую проверку хотя 
бы в будущем. Статистическая гипотеза — это научная гипотеза, 
допускающая статистическую проверку. Под статистической ги- 
пользой обычно понимазот формальное предположение о том, что 
сходство (или различие) некоторых параметрических либо функ 
циональных характеристик случайно (или, наоборот, неслучай- 
но). Поэтому содержательные предположения по поводу иссле 
дуемых явлений должны быть переформулированы определенным 
образом. Например, изучается влияние на время реакции (и) фак- 
тора =. Пусть имеются две ‘серии опытов: экспериментальная, где 
z 20, и контрольная, где 2 = 0. Обычная научная гипотеза в такой 
ситуации гласит: фактор 2 влияет (или не влияет) на время реак- 
ции. Сталистическая гипотеза формулируется иначе: безусловное 
распределение времени реакции F(u) неслучайно (или случайно) 
отличается от условного распределения F(u/z). В дальнейшем 
изложении будут приведены и другие формулировки статистиче- 
ских гипотез. 

Проверка статистической гипотезы состоит в том, чтобы опре- 
делить вероятность случайности или неслучайности. различий 
(или сходства). При этом гипотеза о случайности (все равно 


различия или сходства) называется «нуль»-гипотезой (Но), а ги- 
потеза о неслучайности называется альтерналивной (H;). Заме- 
тим, что проверка предполагает, во-первых, сомнение в истин- 
ности гипотезы и, во-вторых, наличие хотя бы двух возможных 
исходов: принять гипотезу или отбросить ее. Следовательно, 
можно рассматривать двумерную систему альтернативных собы- 
тий: проверяемая гипотеза объективно истинна или ложна и 
действия исследователя, проверяющего гипотезу, — принять ее 
либо отклонить. Введя подходящие обозначения, записываем: 
J = (И, Л), = (1,0). Для этой системы принято в общем ви- 
де задавать безусловное распределение априорных вероятностей 
гипотезы 


AF) = {Р(И), P(A} (5.2) 


и матрицу условных распределений вероятностей для действий 
лица, проверяющего гипотезу, 


и | J 
asiny=6('2" абв). 6.3) 


где 1 -а = Р(П/И), а = Р(О/И) — условные вероятности принять 
или отклонить гипотезу, если она истинна, а В = Р(П/Л),1-А= 
Р(О/Л) — условные вероятности тех же действий, когда гипотеза. 
ложна (обозначения а и В общеприняты). 

Распределения (5,2 и 5.3) необходимы и достаточны, чтобы вос- 
становить полное распределение вероятностей данной системы по 
формуле (1.22): 


и J 
91-5) = HT) oH4/T) = Ц ("5") ean (,2,)e = 
и a 


_п Pa ‚ ВР(Л) 
о | ap) @-ЯР) 


Теперь по полному распределению можно установить частное рас- 
пределение действий исследователя: 


П | (1-а)Р(И Р(Л 
w= Dae 3 ("cet tae aeun] 
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и вторую матрицу условных распределений так называемых ano- 
стериорныт вероятностей гипотезы по формулам (1.23): 


п / Р(И/) РОЛЛ 
эт) = аз = | ------------- = 
О \ Р(И/О) Р(Л/О) 


[1 - а)Р(И),ВР(Л)] : (1 — @) P(M) + ВР(Л]] 


п 
и р 
[aP(M), (1 — В)Р(Л)] : [&Р(И) + (1 - В)Р(Л)] 
J и 
п (1-а)Р(И) ВР(Л) 
ИР + AP) T= =P) + aPC 
=. о аР(И) (1-А)Р(л) (5.4) 


аР(И)+@-ВР(Л) аР(И) + (1 В)Р(Л) 
где по-прежнему условные распределения разделены пунктиром, 
Отметим, что апостериорные условные вероятности в (5.4) опреде- 
ляются на основании принципа Бейеса (см. раздел 5.3.2) и служат 
для эмпирического уточнения априорно выбранных безусловных 
вероятностей истинности или ложности гипотезы. 

Поведение исследователя, проверяющего статистическую гипо- 
тезу, может быть верным или неверным. Верное поведение (со- 
бытие ВП) объединяет принятие объективно истинной гипотезы 
(событие ПИ) и отклонение ложной (событие ОЛ). Неверное по- 
ведение (событие НП) объединяет ошибки первого (ОИ) ивторого 
(ПЛ) рода. Тогда вероятности верного и неверного поведения вы- 
ражаются следующим образом: 

Р(ВП) = Р(ПИ) + Р(ОЛ) = Р(И)(1 — а) + (1 - В)Р(Л), 
Р(НП) = Р(ПЛ) + Р(ОИ) = Р(И)а + ВР(Л), (5.5) 
Р(ВП) + Р(НП) = 1. 

Отсюда можно видеть, что при фиксированных значениях Р(И) 
и Р(Л) вероятности верного и неверного поведения непосредствен- 
но зависят от а- и В-вероятностей ошибок первого и второго рода. 
Поэтому, задаваясь подходящими значениями а и В, можно мак- 
симизироваль Р(ВП) или минимизировать Р(НП). Практически 
важным, в этой связи, является вопрос о выборе величин а и Вс 
учетом величины Р(И) и Р(Л). Здесь выделяют следующие слу- 
чаи. 

Симметричные гчпотезы — при Р(И) = Р(Л). Заметим, что из 
(5.5) тогда имеем 

Р(ВП) =1-0,5(а +В), 


т.е. верное поведение зависит лишь от а и Й, причем при прочих 
равных условиях безразлично: a = р, а > В или а < В, лишь бы 
сумма а + В была поменьше. 

Несимметричные гипотезы—при Р(И) > Р(Л) или Р(И) < 
Р(Л). Здесь положение иное. Если Р(И) > Р(Л), то Р(ВИ) 
определяется преимущественно первым слагаемым в правой ча- 
сти (5.5), даже при a = В. Но можно еще увеличить Р(ВП), умень- 
Wan a, хотя бы и за счет Д, т.е. выгодно выбирать a < В. Если 
же, наоборот, Р(И) < Р(Л), тогда Р(ВП) преимущественно опре- 
деляется вторым слагаемым в (5.5), и следует максимизировать 
его, уменьшая Д, т.е. выбирая а > В. Заметим, что это модели 
ожидания и неожиданности: при ожидании у человека повышается 
В-вероятность, а при неожиданности, наоборот, — а-вероятность. 

Таким образом, выбор стратегии поведения исследователя при 
проверке статистической гипотезы определяется наличием апри- 
орной информации о Р(И) и Р(Л)— об истинности или ложности 
проверяемой гипотезы. Если таковая информация полностью от- 
сутствует, то выгодно считать Р(Л) = Р(И) и, минимизируя а и 
В, одинаково часто принимать решение об истинности и ложно- 
сти гипотезы. При наличии верной априорной информации вы- 
бирают а < В или, наоборот, соответственно Р(И) > Р(Л) или 
Р(И) < Р(Л). Но такой выбор затрудняет дело при неверной 
априорной информации. В этой связи a и Й выступают в каче- 
стве непосредственных мер ненадежности, а вероятности 1 -аи 

— В— в качестве мер надежности статистических оценок. 


5.1.4, Задачи статистической проверки гипотез в психологических исследованиях 


Первой основной задачей статистической проверки гипотез 
является репрезентативное выборочное описание свойств гене- 
ральных совокупностей. С учетом вышесказанного о различиях 
между выборками и генеральными совокупностями ясно, что для 
такого описания значительных по объему совокупностей психи- 
ческих свойств, состояний, процессов и функций требуется нако- 
пление огромного выборочного материала, путем многократных, 
зачастую крупномасштабных исследований. Несмотря на значи- 
тельное количество экспериментальных работ, накопленный ‘мате- 
риал недостаточен, а крупномасштабных ‘исследований, необходи- 
мых в психологии, пока не проводится. Отсутствуют и выборки 
панельного типа. Поэтому задача репрезентативного описания, 
решение которой предполагает накопление материала, сводится 
ко второй основной задаче, а именно — к проверке однородности 
выборочных описаний, полученных в разных исследованиях, и к 
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обобщению однородных данных. Заметим в этой связи, что для 
проверки однородности необходима однообразность статистиче- 
ских описаний одних и тех же психических явлений разными ав- 
торами с указанием в публикациях объема выборок, по которым 
вычислялись статистические оценки параметров и функций. 

Можно выделить также ряд частных задач, решение которых 
способствует решению указанных основных. Для любых гене- 
ральных совокупностей это, во-первых, сопоставление выбороч- 
ных параметрических и функциональных характеристик с ана- 
логичными характеристиками известных генеральных совокупно- 
стей (или, по крайней мере, с выборками большего объема), во- 
вторых, аппроксимация функций распределения и связи теорети- 
ческими кривыми. Для гетерогенных совокупностей это выявле- 
ние структуры совокупности (в частности, определение числа су- 
щественных переменных, необходимого и достаточного для описа- 
ния совокупности), определение вида и характера связей между 
переменными и минимизация числа переменных. Дальнейшую де- 
тализацию задач можно проводить в соответствии с конкретными 
видами параметрических и функциональных характеристик сово- 
купностей и выборок (см. рис. 5.1-5.3). 

Резюмируя, подчеркнем, что задачи статистической проверки 
гипотез являются необходимой частью научных задач, стоящих 
перед психологами и представителями смежных наук, но не ис- 
черпывают всего множества таких задач. Поэтому формальные 
методы математической статистики должны не заменять, а допол- 
нять содержательные методы психологических дисциплин 


$1. СТАТИСТИЧЕСКИЕ КРИТЕРИИ ОЦЕНИВАНИЯ И ПРОВЕРКИ ГИПОТЕЗ 


$ 1, Понятие о статистических критериях 


Под критерием вообще понимается решающее правило, обусло- 
вливающее поведение в ситуации выбора. Статистическим кри- 
‘терием (в отличие от других научных критериев) называется пра- 
вило, обеспечивающее надежное поведение, т.е. принятие истин- 
ной и отклонение ложной гипотезы с высокой вероятностью. 

В качестве критериев в математической статистике использу- 
ются определенные случайные величины, которые являются не- 
случайными функциями от изучаемых случайных величин и от 
так называемого числа степеней свободы, зависящего от числа на- 
блюдений. Пусть критерием является случайная величина Y* = 
¥(0*, и), где ф — неслучайная функция от параметра 0” и числа 
степеней свободы и. Должна быть известна функция распределе- 


ния Р(Уу, и), которая обычно табулируется (как это сделано в 
табл. VII—X Приложения 2). Тогда использование критерия У* 
для оценки 9 параметра 6° или проверки статистической гипотезы 
06 этом параметре состоит в следующем. При оценке неизвестно- 
го параметра 0" доверительным интервалом (5.1) для выбранной a 
по таблицам распределения Р(У;, и) определяется теоретическое 
значение квантиля критерия У: ›, которое показывает, насколько 
стандартных погрешностей 0(9) может отклоняться значение па- 
раметра 9* от его выборочной оценки 9 при данном числе степеней 
свободы (как функции от объема выборки): 


9-Yz,0(0) <" <0+Y¥z,0(8). 


При проверке гипотезы относительно 6° всегда в сущности про- 
веряется вопрос, может служить 0 оценкой 0" или нет. При этом 
формулировать «нулевую» гипотезу можно относительно разли- 
una ди 6": «различие случайно», но тогда альтернативная гипо- 
теза формулируется относительно сходства: «сходство неслучай- 
но». Можно, наоборот, формулироваль «нулевую» гипотезу отно- 
сительно сходствай и 9*: «сходство случайно», но тогда альтерна- 
тивная гипотеза касается различия: «различие неслучайно». При 
такой классической (альтернативной) формулировке гипотез по 
выборке находят оценку параметра 0. По функции ф вычисляют 
эмпирическое значение критерия У*, а по таблице ЕР(У;, к) нахо- 
AAT для заданного а и обусловленного объемом выборки и теоре- 
тическое значение квантиля Ут, и производят сравнение: 


У У, или У У, (5.6) 


Смысл выражения (5.6) можно пояснить следующим образом. 
Вспомним, что квантиль У» есть значение переменной 7’, которо- 
му соответствует доля площади под кривой плотности, численно 
равная вероятности а. Тогда, изображая вероятности a и 1 — а, 
как показано на рис. 5.6, а, 6, и учитывая табл. 5.2, можем записать 
правила выбора. Если Y° <Y3,, то различие 8 и 0* случайно, 

—_— 


область 1-а 
а сходство неслучайно (рис. 5.6, а), следовательно, принимается 
гипотеза о сходстве эмпирической оценки @ с теоретическим па- 
раметром 9". Если же У? > У»,, то сходство 8 и 6° случайно, а 

—_— 

обльсть а 
различие неслучайно (рис.5.6, 6), следовательно, принимается ги- 
потеза о различии между оценкой 9 и параметром 6°. Заметим, 
Что, проверяя в качестве «нулевой» гипотезу о сходстве, мы при- 
нимаем альтернативную гипотезу о различии, и наоборот, про- 
веряя в качестве «нулевой» гипотезу о различии, мы принимаем 
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Рис. 5.6. Сопоставление эмпирического и критического значений 
квантилей. 

1— эмпирическое, 2— теорстическое распределения. По оси орли- 
нат плотности вероятностей /(У), по оси абсцисс — значения У. 
— незаштрихованная площадь под кривыми panna а, У < Уз, — 
различие случайно, а сходство неслучайно; б— иезаштрихованная 
площадь под кривыми равна 1 — a, У* > Ут, — сходство случайно, a 
различие неслучайно: 

для 1 - а и велика для a, при этом Yo, < У* < У) и, где ay + аз — 
интервал неопределенности; чтобы обоснованно принять или откло- 
нить гипотезу, необходимо провести дополнительные наблюдения. 


— заштрихованная область пересечения мала 


альтернативную гипотезу о сходстве, т.е. статистическую гипо- 
тезу проверяют доказательством «от противного». 

Среди возможных статистических критериев выделяют: одно- 
сторонние и двусторонние, параметрические и непараметриче- 
ские, более мощные и менее мощные. 

Понятие одностороннего либо двустороннего критерия связано 
с формулировкой гипотез. Если «нулевая» гипотеза. формулиру- 
ется о равенстве (сходстве) @ = 6°, то для проверки использует- 
ся двусторонний критерий, теоретический квантиль которого Yow 
определяется, в сущности, для 0, 5a, как показано на рис. 5.7, а. 
Если же «нулевая» гипотеза формулируется о неравенстье (раз- 
личии), то возможны три формулировки: 9 $ 8°, 0 > 6° uO < O° 
Jina первой формулировки снова используется двусторонний кри- 
терий, но для второй и третьей — односторонние. Смысл односто- 
роннего критерия — это нижняя и верхняя граница доверительно- 


Рис. 5.7. Пвусторонний (а) и односторонние (6, 4) критерии. 
Объиснения в тексте. 


го интервала (рис, 5.7, би в), соответственно говорят о нижнем 
критическом значении (рис. 5.7, 6) и верхнем критическом значе- 
нии (рис. 5.7, ®) критерия У*. 

Параметрические критерии — это некоторые функции от пара- 
метров совокупности. Они служат для проверки гипотез об этих 
параметрах или для их оценивания. Непараметрические крите- 
рии — это некоторые функции от функций распределения или не- 
посредственно от вариационного ряда наблюдавшихся значений 
изучаемого случайного явления. Они служат только для провер- 
ки гипотез о функциях распределения или о рядах наблюдавшихся 
значений. 

Важнейшей характеристикой любого статистического крите- 
рия является его мощность. Под мощностью критерия понима- 
ется его способность правильно отбрасываль ложную гипотезу. 
Мощность оценивается вероятностью 1 — В и, следовательно, со- 
гласно уравнениям (5.5), зависит от вероятностей Р(И), Р(Л) иа, 
так что один и тот же критерий может иметь разную мощность 


для различных сочетаний этих вероятностей. Функция, опреде- 
‘ляющая значения 1 — В в зависимости от указанных веролтностей 
и числа наблюдений, называется функцией мощности критерия. 
Она позволяет, смотря по обстоятельствам, выбрать подходящий 
критерий для практического использования, а также учитывается 
при разработке новых критериев. 

В математической статистике для различных приложений со- 
здано большое количество параметрических и непараметрических 
критериев, многие из которых маломощны или не определены по 
мощности. Поэтому в психологических приложениях лучше поль- 
зоваться сравнительно небольшим набором основных критериев, 
наиболее мощных в большинстве случаев. Их мы и рассмотрим 
ниже. 


i,t... Х -критерий Пирсона 
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Наиболее мощным непараметрическим критерием является кри- 
терий x? по Пирсону. Пусть 1, y2,---,Yy — независимые случай- 
ные величины, распределенные нормально со средним арифмети- 
ческим, равным нулю, и дисперсией, равной единице. Тогда сумма. 
квадратов этих величин x? = }\_, У? распределена с плотностью, 
зависящей только от и и при увеличении и асимптотически стре- 
мящейся к нормальной плотности, как показано на рис. 5.8. 


6,2 


о 


Рис. 5.8. Плотность x?-pacnpe- 
деления. 2 
По оси ординат — плотность, по оси 
абсцисс — значения х2. 1—-и =]; 


2—и= = 10. 


5 10 15 20 


Величина и называется числом степеней свободы. Остановимся 
на этом понятии подробно. В математической статистике под чи- 
слом степеней свободы понимается число фактически возможных 
направлений изменчивости. В этой связи выделяются следующие 
понятия: число (теоретически) возможных степеней свободы, чи- 
сло «связанных» степеней свободы и число «свободных», т.е. фак- 
тически возможных, степеней свободы. 
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Число возможниыт степеней свободы есть количество наблю- 
дений. Это для отдельного события — число случаев его появле- 
ния и непоявления (п). Для отдельной случайной величины — это 
вектор значений величины числом п, а для вариационного ря- 
да— число классов группировки Ё. Jina двумерной системы ве- 
личин (или событий) при несгруппированных данных — это п?, a 
при сгруппированных —kyky. Наконец, в общем случае №-мерной 
случайной системы — это общее число пересечений интервалов 
квантования [., причем величины #; и L являются функциями от 
числа наблюдений. 

Число «связанных» («несвободных») степеней свободы пони- 
мается следующим образом. Пусть суммируются п значений #1; 
вектора. xX, результатом чего является yy, гг. Тогда можно со- 
хранять их сумму фиксированной при любом случайном сочета- 
нии п — 1 значений х;, лишь бы одно из этих значений неслучай- 
ным образом дополняло остальные. Следовательно, одно значе- 
ние является «связанным» при всяком суммировании. Аналогич- 
но при г суммированиях связывается г степеней свободы. Заме- 
тим, что, вычисляя г моментов распределения (считая нулевые 
моменты), мы суммируем г раз, так что для одномерного распре- 
деления с числом параметров | всегда «связывается» г = {+1 
степень свободы. Так, для нормального, гамма- и биномиального 
распределений число связываемых степеней свободы г = 3, для 
пуассоновского —г = 2 

Число фактически возможных («свободных») степеней свободы 
(v) определяется разностью между числом теоретически возмож- 
ных и числом «связанных» степеней свободы. Лля вектора зна- 
чений (или вероятностей) случайной величины и = п — 1; для ее 
распределения, полученного группировкой наблюдений в & интер- 
валов, v = k—r; для таблицы М№-мерного распределения вероятно- 
стей системы событий (или случайных величин) и = (п-1)х(т-1), 
где п — число строк, а т — число столбцов такой таблицы. 

Основные направления в применении Х?-критерия: а) оценка 
сходства (различия) двух и более распределений; 6) оценка стоха- 
стической независимости (зависимости) систем случайных собы- 
тий и величин, а также сравнение матриц переходных вероятно- 
стей для оценки цепи событий как бернуллиевской или марковской 
(простой или сложной); в) проверка однородности парных корре- 
ляций; г) формирование других статистических критериев. 

Сравнение двуг распределений может осуществляться как срав- 
нение выборочного распределения с каким-либо теоретическим 
законом или как сравнение двух и более выборочных распределе- 
ний. В первом случае проверяется гипотеза о том, можно ли рас- 
смалтривать отличия выборочного распределения от его теорети- 


ческой аппроксимации данного вида как случайные, иначе говоря, 
является ли выборочное распределение нормальным, гамма- или 
каким-нибудь другим. Во втором случае ставится вопрос о том, 
случайны ли различия между двумя или несколькими выбороч- 
ными распределениями (к какому бы виду они не принадлежали). 
Рассмотрим оба случая на примерах. 

Пример 5.1. В примере 2.6 эмпирический ряд распределения 
значений амплитуды установившихся колебаний руки человека. 
был аппроксимирован нормальным распределением. Значения ча- 
стостей р и вероятностей P* приводились в табл. 2.11. Проверим 
для этих данных, пользуясь критерием Х?, следующую «нулевую» 
гипотезу: отличия выборочного распределения частостей от тео- 
ретического нормального распределения вероятностей являются 
случайными. 

При сравнении выборочного и зппроксимирующего распреде- 
лений используется следующая формула х?-критерия: 


(5.7a) 
или 

(5.76) 
где Ди ff — эмпирическая и теоретическая частоты #го интерва- 


ла группировки; р; и Р; — частости и аппроксимирующие вероят- 
ности; п— число наблюдений; пр; = fi, nP? = №; К— число ин- 
тервалов группировки после объединения интервалов, в которых 
д<5. 

Так как два верхних интервала в эмпирическом распределении 
имеют частоты меньше пяти, их следует объединить, суммируя 
частости. Аналогично следует частость последнего интервала 
суммировать с частостью третьего снизу интервала. Соответ- 
ственно суммируются и вероятности P*. В результате для вычи- 
сления эмпирического Х? используются р; и P*, представленные в 
табл. 5.3; там же показано и вычисление x? по формуле (5.7a). 

Мы проверяем гипотезу о нормальном распределении, у которо- 
го два параметра; значит, г =Зии= #-3. По табл. УП Приложе- 
ния 2 находим, что с доверительной вероятностью 0,95 квантиль 
Х30в/ь=в = 11,1. Это больше эмпирического x? = 9,88. Следо- 
вательно, отличия эмпирического распределения от нормального 
можно считать случайными, аппроксимация удовлетворительна. 

Сравнивать две или более эмпирических совокупностей обычно 
требуется для того, чтобы установить, являются ли они выборка- 
ми из одной и той же генеральной совокупности и можно ли их 


Таблица 5.3 
Вычисление x? к примеру 5.1 


Pe | bee— Pri] + - Pry? | в - PrP PP 
0,018} 0,006 0, 000036 0,0025 
0,054 0,010 0,001000 0,0185 
0,119 | 0,006 0,000036 0,0003. 
0,193 | 0,048 0, 002304 0,0119 
0,231 0,059 0, 003481 0,0151 
0,185 | 0,193 0,008 0, 000064 0,0003 
0,110 | 0,119 0,009 0, 000081 0,0007 
0,075 | 0,072 | 0,003 0, 000009. 0,0001 


x? =200.0,0494 = 9,88 


x? < xB oss = Иа 


объединить, чтобы получить выборку большего объема, Пусть 
имеется з эмпирических распределений, полученных в несколько 
различных условиях (например, разными авторами) и имеющих 
(в общем случае) неодинаковые объемы п; (j = 1,2,...,5). Если 
это случайные выборки из одной совокупности, то логично пред- 
полагать, что их частости Pi; в каждом 1-м интервале случайным 
образом рассеиваются вокруг теоретической вероятности Р! i-ro 
интервала группировки. Тогда ожидаемую частость P* выборки 
суммарного объема Хуа п; разумно определить как взвешенное 
среднее арифметическое частостей Pij объединяемых выборок: 


(5.8) 


„Для получения расчетной формулы Х?-критерия в случае срав- 
нения произвольного. cee $ выборок неравных объемов п; вос- 
пользуемся свойством Х?-распределения, ng yee которому сум- 
ма из $ независимых слагаемых, ны Х?-распределение с и; 
степенями ИИ bg имеет Х?-распределение с числом сте- 
пеней свободы a - Тогда. 


где а для проверяемых (объединяемых) выборок число 
интервалов группировки; Р’ определено выше уравнением (5.8), 
ри; — частости го интервала 7-го эмпирического распределения. 
Так как ‘She может быть больше либо меньше единицы, берет- 


ся абсолютное отклонение этой суммы от единицы. Число степе- 
ней свободы и, необходимое в этом случае для определения кван- 
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quan Хх? , из табл. УП Приложения 2, находят следующим образом. 
Каждое из слагаемых x? определяют, исходя из и = k - 1 степе- 
ней свободы (одна степень «связывается» на нулевой начальный 
момент). Ho суммируют з слагаемых, и на эту сумму тоже «связы- 
вается» одна степень свободы, так что всего получается степеней 
свободы 


8—1 
v= (k-1) =(s- (k= 1). (5.10) 
j=l 


Пример 5.2. Существует три способа группировки, различаю- 
шихся принципом размещения «граничных» значений вариант по 
интервалам. Требуется оценить, будут ли однородными эмпири- 
ческие распределения, получаемые такими разными способами 
Исходные данные приведены в табл. 5.4. 


Тоблица 5.4 
Вычисление x? к примеру 5.2 

m | Pe Py ГВЕН 
0,025 | 0, 000625 6,25 : 275 = 0,0227 
0,045 | 0,002025 20, 25 : 575 = 0,0352 
0,125 | 0,015625 ит.д. 0,1250 
0,145 | 0,021025 0,1237 

ps1 | 0,290 | 0,084100 0,3058 
0,185 | 0,029425 0,1658 
0,110 | 0,012100 0, 1180 
0,075 | 0,005625 0,0865 
0,030 | 0, 000900 9: 275 = 0,0327 
0,070 | 0,004900 49 : 575 = 0,0852 
0,125 | 0,015625 ит.д. 0,1250 
0,195 | 0,038025 0,2237 

pi 2 | 0,260 | 0,067600 0, 2458 
0,170 | 0,028900 0, 1628 
0,095 | 0, 009025 0,0881 
0,055 | 0,003025 0,0466. 
0,0275 
0,0575 

2 J a 

0,1250 | Df, 5% = 0,9827, Di, 2 = 1,0099, 
0,1700 

Pi 3 | 0,2750 200(|0,9827 — 1| + [1,0099 — 1|) = 4,72, 
0,1775 
0,1025 | и=(2-1)(8-П=Т, ха osjyer = 14,1, 
0,0650 м 

x? <XB.05/7 
n= 200 


Теоретическая вероятность (как частость объединенной выбор- 
ки) определяется здесь, очевидно, как (ра + ра + из) : 3 = pis. 
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При этом ни кчему вычислять p?,/p;3, а, pis = 1. Следователь- 
но, вычислительная формула Х? для нашего примера получается 
из формулы (5.9) путем несложных преобразований: 


Результаты вычислений и проверки гипотезы приведены в 
табл. 5.4. Можно видеть, что эмпирические распределения, по- 
лученные разными способами группировки, однородны. Следует, 
однако, заметить, что данный вывод справедлив лишь при п = 200. 
Нетрудно видеть, что уже при п > 600 различие в способах труп- 
пировки приведет к неоднородности нолучаемых эмпирических 
распределений, а это в конечном счете означает неадекватность 
выборочного описания генеральной совокупности. 

Оценка статистической однородности может выполнятся для 
двух и более многомерных распределений частостей событий (ве- 
личин). Тем самым решается вопрос о возможности объединения 
соответствующих выборок в одну большего объема. 

Пример 5.3. В примере 4.1 оценивалось распределение значе- 
НИЙ социометрического статуса, эмоциональной экспансивности 
и нейротизма для выборки объемом п: = 42 у студентов одно- 
го курса психологического факультета (табл. 4.4). Для студентов 
другого курса получена новая выборка, объемом no = 57, для ко- 
торой распределение частостей приведено в табл. 5.5. Требуется 
проверить, однородны ли обе выборки в статистическом смысле, 
и если да, то объединить их. 


Таблица 5.5 
Чвстоети совместного распределенил социометрического статуса (Хз), 
нейротизма (Хз) и эмоциональной экспансивности (Хз) второй 
выборки студентов (к примеру 5.3) 


ти = Х2 < 13,5 


Х. 20 


Piz2 = 0,02 
раза = 0,30 


Риз = 0,12 Pia 
Pai2 = 0,52 Paai 


Пользуясь формулой (5,8), вычислим ожидаемые значения ча- 
стостей в объединенной выборке: 


ин = a, 07-4240, 00-57) = 0,03, 


Риз = Gols 07-42-+0, 12-57) = 0,10 


Таблица 5.6 
Вычисление x? к примеру 5.3 


Ph=i2 | Pijmk 


PL 


P2 


1,152, 


Pum | 0,05 


= 42, mg = 57, Xx? = 42(1,152 —1) + 57(1118 - 1) я 13,1, 
п= 99 @-18-1)=7, 
т = 14 > x? = 131 


ит.д. — результаты проведены в табл. 5.6. Остальной расчет x? 
осуществим по формуле (5.9), как показано в табл. 5.6. Можно ви- 
деть, что различия частостей случайны, значит, обе выборки ста- 
тистически однородны и допустимо объединение. Частости объ- 
единенной выборки приведены в табл. 5.7. Заметим, что это те же 
самые ожидаемые частости р};!„, что и в табл. 5.6. 

Оценка стохастической независимости компонентов в системе 
случайных событий (величин) осуществляется путем сопоставле- 
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ния эмпирической величины x7, образующей числитель в форму- 
лах (2.48а-в) и (4.15) для коэффициента Чупрова, с табличным 
значением квантиля х2 „. Причем число степеней свободы всегда, 
определяется по уравнению (5.10) как и = (т- 1)(п — 1), где т— 
число строк таблицы совместного распределения частостей собы- 
тий (величин), а п— число столбцов; для формулы (4.15) т=Ёи 
п = 9. «Нулевая» гипотеза в этом случае формулируется, напри- 
мер, так: «величина коэффициента Чупрова случайно отличается 
от нуля (незначима)», т.е. стохастическая связь отсутствует, со- 
бытия (величины) независимы в стохастическом смысле. 


Таблица 5.7 
Частости совместного распределения социометрического статуса (X;), 
нейротизма (X2) и эмоциональной эмспансивности (X3) 
в объединенной выборке (п = 99) 


ta = Xz < 13,5 213 = Xp > 13,5 


1 = Хз <0 | 232 ЕЛ: 20 | ги = № <0] 299 = Xs DO 


ги 2X1 < 0 | ри =0,03 | р:12 =0,10 | раз = 0,04 | ризз = 0,02 
212 =X1 20| ри =0,05 | раз =0,45 | peor =0,03 | раза = 0,28 


Пример 5.4. Проверим значимость коэффициента Чупрова, 
вычисленного в примерах 1.11 и 4.1. В первом из них оценивалась 
сопряженность между цветом волос и цветом глаз. Эмпирическое 
значение y? = 106; при и = (3- 1)(4 —1) = 6 из табл. УП Прило- 
жения 2 находим: Xj 91/6 = 16,8, что значительно меньше эмпири- 
ческого х?. Следовательно, искомая сопряженность несомненна, 
иК = 0, 25 значимо отличается от нуля 

Во втором примере эмпирическое значение х? = 9,28. При чи- 
сле степеней свободы и = (2 - 1)(4 —1) = 3 квантиль Xo,01/3 = 11,3, 
а квантиль Хо,05/з = 7,82. Оказывается, что имеет место не пре- 
дусмотренный нами до сих пор случай: Xbjo0/3 gang Хань 
Этот случай будет подробнее рассмотрен в $ 5.3, а здесь отме- 
тим, что в такой ситуации обоснованное решение принять нельзя: 
требуются дополнительные наблюдения. Можно, однако, пред- 
полагать, что при увеличении числа наблюдений наличие стоха- 
стической связи статуса, эмоциональной экспансивности и ней- 
ротизма будет статистически обосновано. Действительно, по ре- 
зультатам предшествующего примера для объединенной выбор- 
ки (99 студентов) значение y? = 13,1. В силу свойства алди- 
тивности х?-распределения, упомянутого выше, эта величина х? 
соответствует числителю коэффициента совместной детермина- 


ции (4.15), определяемого для совместного распределения часто- 
стей объединенной выборки, представленных в табл. 5.7. Так как 
x? = 13,1 > ХЗ луз = 11,3, можно считать, что статус, экспансив- 
ность и нейротизм стохастически зависимы. Определяя заново по 
(4.15) коэффициент совместной детерминации, получаем достовер- 
но отличные от нуля значения: КЗ, ~ 0, 0765 и Км = 0,28. 


Оценка эмпирической последовательности событий как бернул- 
лиевской или марковской цепи (простой или сложной) может со- 
стоять в проверке однородности матриц переходных частостей, 
вычисленных для разных начал отсчета перехода, либо (для про- 
верки «простоты» цепи Маркова) в сопоставлении $ эмпириче- 
ских матриц последовательных переходов Аз,..., А, +1 с матрица- 
ми AS = 42,43 = 4,....А = АЙ, вычисленными в предпо- 
ложении, что аппроксимирующая цепь Маркова — простая. При 
такой проверке эмпирическое значение х? вычисляется по форму- 
ne (5.9), а число степеней свободы для квантиля X32, определяется 
по формуле (5.10), где & — порядок матриц перехода. 


Проверка однородности парныг корреляций может осуществлять- 
‘ся для диагональных элементов корреляционной матрицы с целью 
установить, стационарна или нет случайная функция, либо для 
некоторых корреляционных матриц с целью установить их одно- 
родность. Поскольку корреляционную матрицу можно рассматри- 
вать как объединение векторов коэффициентов корреляции (строк 
или диагоналей), то начнем с более общего случая проверки од- 
нородности корреляционных матриц. 


Пусть требуется проверить однородность $ корреляционных 
матриц порядка N. Для каждого из 0,5N(N — 1) различных ко- 
эффициентов корреляции rije (i М HS, san NG BO 
if j;k = 1,2,...,8) по табл. Ш Приложения 2 определяется co- 
ответствующее 2;;+-преобразование Фишера. Тогда для каждого 
коэффициента корреляции г;; имеем в сопоставляемых матрицах 
1-й вектор из $ 2у-преобразований, распределенных асимптоти- 
чески нормально, с общим средним арифметическим Е и диспе- 
рсией ошибки 


1 
ль—3’ 


D(zije) = 


где п, — объем выборки, из которой определены коэффициенты 
корреляции -Й матрицы. Как и прежде, будем считать, что ожи- 
даемое среднее арифметическое значение 2}; для 1-го вектора есть 


среднее взвешенное: 


в — З) 26% 
. ai(m —3) 7 
= 1 
=. ij при nm=ng>-:-= . 
Py ate iP. 1 2 ne 


dina $ матриц порядка N всего имеется L = 0, 5М№М(М — 1) раз- 
личных [-х векторов (| = 1,2,..., Г), которые надо сопоставлять. 
В этой связи эмпирическое значение x? может быть получено как 
сумма по L и з взвешенных частотой (пу — 3) квадратов централь- 
ных отклонений (2454 — 25,1): 


ba 
v= YY — 3)(zize — 2)? = 


= 
. ы 2 
=> {Sm Зак - Ре Зы Deel } , 
т (+= Diar(m ~ 3) (5.11) 
где [=1,2,..., [ — номера вектора проверяемых на. однородность 


коэффициентов корреляции. При одинаковых объемах выборок 
все ny Е п, и формула (5.11) упрощается: 


Le 
x? = (n-3) >) Ха — 2h)? = 


ты 
cfs . z 

=(n-3)> 24-1 (Ean) | (5.12) 
tet [Е=1 kak 


При сопоставлении матриц корреляций, как и для матриц веро- 
лтностей, число степеней свободы определяется формулой (5.10), 
что в новых обозначениях дает и = (L —1)(s — 1). 

Сопоставление $ коэффициентов корреляции «внутри» [-го век- 
тора, очевидно, должно осуществлятся по тем же формулам (5.11 
или 5.12), если TL, = 1. Соответственно число степеней свободы 
будети=з- 1. 

Пример 5.5. В табл. 4.7, 2 представлены коэффициенты линей- 
ной корреляции между социометрическим статусом (Х!), нейро- 
тизмом (Xz) и эмоциональной экспансивностью (Хз), полученные 
на второй выборке студентов (nz = 57). Проверить однородность 
этих корреляций с полученными на первой выборке (табл. 4.7, 6). 

В данном случае s =2и L = 3. Определив по табл. Ш Приложе- 
ния 2 необходимые 2;-преобразования, произведем вычисления по 
формуле (5.11). Все промежуточные и окончательные результаты 
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Таблица 5.8 
Проверка однородности двух корреляционных матриц 
к примеру 5.5 


Выборка | тк арк [ак — Aye | (Zink — yu)? | (пк — Vise — he)? 
—0,234]—0,2342| 0,0308 | 0,00013864 0,00540696 

Первая | 0,302| 0,3095| 0,0853 | 0,00727609 0,28376751 
-0,238|-0,2448| 0,0694 | 0,00481636 0, 18783804 
—0,276|--0,2877| 0,0277 | 0,00051529 0,02782566 

Вторая | 0,162| 0,1614] 0,0628 | 0,00394384 0,21296736 
—0,347|-0,3654| 0,0512 | 0,00262144 0, 14155776 
—0,259| —0, 2650 


Объеди-| 0,220) 0,2242 


ненная |-0,304|-0,3142| =7;, = gg (0, 2342. 42 + 0, 2877-57) = 0,2650, 


21: = 50,3095. 42 + 0, 1614-57) = 


, 2242, 


my =42, по =57, 
n=99 35 (0, 2448 - 42 + 0,5654- 57) = 0,3142, 
x? = Dher Dies (me — 3)(2iyk — 311)? = 0, 85936329 = 0,86, 


2-1)(3-1) =2, Хоа = 5,99 > x? = 0, 86, т.е. выборки однородны 


представлены в табл. 5.8. Так как выборки однородны, корреляци- 
онную матрицу объединенной выборки объемом 99 человек полу- 
чаем, выполнив по табл. [У Приложения 2 обратное преобразова- 
ние средних 2, в коэффициенты корреляции т;; (они представлены 
в табл. 5.8): г12 = —0, 259; ris = 0, 220; res = —0,304. 

Пример 5.6. В примере 4.2 рассматривалась нормированная 
автокорреляционная функция случайной ошибки слежения. Что- 
бы установить, стационарна ошибка слежения как случайный про- 
цесс или нет, надо проверить, зависят ли значения нормированной 
автокорреляционной функции от начала отсчета сдвига т. Если 
они не зависят от начала отсчета, то гу, лежащие на [it диа- 
гонали корреляционной матрицы (табл. 4.1), должны быть одно- 
родны. Проверим однородность коэффициентов rij, лежащих Ha 
первой диагонали (считая вверх и вправо от главной диагонали) 
табл. 4.13. 

Tak как число наблюдений п одинаково для всех s = 10 коэф- 
фициентов гу, TO вычисление x? произведем по формуле (5.12), по- 
лагая SL, = 1, как показано в табл. 5.9. Можно видеть, что при 
данном числе наблюдений (п = 23) нет оснований отклонять гипо- 
тезу об однородности Tj, вычисленных при одинаковых сдвигах 
т, но разных началах отсчета т. Следовательно, можно усреднять 
коэффициенты, вычисляя Ryy, как и сделано в табл. 4.13. 
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Таблица 5.9 


Проверка однородности вектора новффициентов 
морреляции к примеру 5.6 


(isa — 3,77 
0, 04857616 


0,1614 


0,42 0,4477 0,00434281 
0,46 0,4973 0, 01334025 
0,18 0, 1820 0,03992004 
0,47 0, 5101 0, 01646089 
0,51 0, 5627 0, 03272481 
0,63 0, 7414 0,12931216 
-0,20 —0, 2027 0, 34164025 
0,58 0, 6625 0,07879249 
0,25 0,2554 0,01597696 


{, = 0,3818 
23 


Сумма: 0,72108682 
20-0,72108682 = 14,4, 


Xb,05/9 = 16,9> x? = 14,4, т.е. можно принять гипотезу 
06 однородности те) 


Мы рассмотрели основные аспекты применения х?-критерия к 
экспериментальным данным. Но он используется и для формиро- 
вания многих параметрических критериев, которые и рассмотрим 
ниже. 


$11. Основные параметрические критерии 


1-критерий Стьюдента 


Если Х — нормально распределенная случайная величина с ну- 
левым средним и дисперсией, равной единице, а независимая от 
нее случайная величина x? имеет Х?-распределение с и степенями 
свободы, то случайная величина 


(5.13) 


имеет {-распределение Стьюдента с р степенями свободы. Плот- 
ность этого распределения зависит только от и, имеет симметрич- 
ную форму и при увеличении и асимитотически стремится к плот- 
ности нормального распределения (рис. 5.9). 

Квантили ta, распределения Стьюдента приведены для а = 
0,05, 0,01 и 0,001 в табл. УШ Приложения 2. Они используются 
AAA интервального оценивания и для проверки гипотез о случай- 
ности различия (сходства) параметров. 


3-2 -1 Oo 1 2 3 


Puc. 5.9. Плотность tpacnpenenenua Стьюдента. 
По оси ординат — плотность, по оси абсцисс — значения (. 


1i—v=1;2—v S—vs0. 


При интервальном оценивании квантиль ty, показывает, как OT- 
мечалось выше (уравнение (5.1)), на сколько стандартных погреш- 
ностей 0(9) может отклоняться в меньшую и большую стороны вы- 
борочная оценка @ от значения параметра 0" в генеральной сово- 
купности. При интервальном оценивании параметров 6", согласно 
классификации на рис. 5.1, поступают следующим образом. 

По выборочной оценке 9 в соответствии с табл. 5.2 вычисляют 
оценку стандартной погрешности o(6). Лалее вычисляют эмпири- 
ческое значение {-критерия: 

ВИ: 
~ 98)’ 
и по табл. УШ Приложения 2 находят для и = п-1 (или п -— 2, 
или п — 3) ближайшее Kt” снизу теоретическое значение квантиля. 
tay, Которое и принимается для указания границ доверительного 
интервала (с доверительной вероятностью | - а): 


0" = 0+4 00). (5.15) 
Важной разновидностью интервального оценивания является 
построение доверительной зоны (области) простой линейной ре- 
грессии u* = ay/,2 + doy. Существо дела здесь состоит в следую- 


щем. Определяются доверительные значения среднего арифмети- 
ческого M(u): 


г 


14) 


чт = М(и) — tayvo[M(u)], 
Umax = М(и) + tavo[M(u)], 

а также доверительные значения углового коэффициента: 
Qmin = @ы/: — tay (Gujz); 


@тах = аи]: +ta,vO(du/z), 


где стандартные ошибки вычисляются по формулам из табл 5.2. 
Далее, как показано на рис. 5.10, через точки с координатами 
(tax; М[2]) и (umin; М[2]) проводят по две прямые, одну под углом 
@) к оси абсцисс, а другую — под углом ay так, чтобы tga} = amin 
и tga2 = Gmax соответственно. В результате заштрихованная на. 
рисунке часть плоскости и является доверительной зоной линии 
регрессии, в которой с вероятностью | — а заключена регрессия, 
соответствующая генеральной совокупности. 


4 
150 
0 
90 
70 
50 
——— Puc. 5.10. Ловерительная область 
50 1 (заштрихована) линии регрессии 
(1-а=0, 999) к примеру 5.8 
10 
IQ По оси абсцисе —статус в своей 


группе (=); по оси ординат — ста- 
‘tye ua курсе (5), ®. 

1—при (МСУ и [ay/s]mins 
2— при [M(¥)}min и [б/а 
3—при [М(У)] ак и [ay/shmins 
4— при [M(Y )]max и [дух лая 


10 20 30 


При проверке гипотез о случайности (неслучайности) сходства. 
(различия) используют в сущности оценку вероятности совмест- 
ного перекрытия (неперекрытия) доверительных интервалов. 
Пусть 0; и 03 — две выборочные оценки некоторого параметра 6". 
Тогда эмпирическое значение {-критерия вычисляется по формуле 
(5.14), в которой 8 = |6; - 6. |: 


> 101 — As) 
в’ 618) 


где o(|9; — 6:|) — стандартная погрешность разности выборочных 
оценок, определяемая по формулам из табл. 5.2. Далее по чи- 
слу степеней свободы и = п - 1(или п -— 2, п - 3) из табл. VIII 
Приложения 2 определяется квантиль 1=,»› для которого либо 
< to o5/v, и тогда принимается проверяемая «нулевая» гипотеза, 
либо {1 > 1,01/», и тогда принимается альтернативная гипотеза. 
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Если 10,05/» < № < to,o1/y, необходимо увеличить число наблюде- 
ний. 

Специальным случаем проверки гипотез с помощью {-критерия 
является оценка значимости некоторого параметра, т.е. оценка 
достоверности отличия величины параметра от нуля. Это отно- 
сится к мерам асимметрии и эксцесса, к мерам детерминации и 
связи. При этом используется формула (5.14), а гипотеза прове- 
ряется так же, как и при оценке сходства (различия). Заметим, 
что проверка значимости коэффициентов корреляции и регрессии 
составляет существо классического корреляционного и регресси- 
онного анализа. 

Пример 5.7. Определить доверительный интервал для веро- 
ятности записывания цифры «7» испытуемым (пример 1.2), если 
число наблюдений п = 1300, а частость р(«7») = 0, 108. 

По табл. 5.2 находим формулу для о(р): 


_ ГА-рр _ [0,108 -0,892 _ 
op) = yo ву = 0,00861. 


По формуле (5.14) определяем 
Р = 0, 108 : 0,00861 = 12,5. 


Из табл. УШ Приложения 2 можно видеть, что при и = 00 toor/y = 
2,58 < №. Следовательно, по формуле (5.15) можем определить 
интервал: 


0, 108 — 2, 58 .0,00861 < p(«7») < 0,108 + 2,58 - 0, 00861 
или 0,086 < p(«7») < 0, 130, 


в котором с доверительной вероятностью 0, 99 заключена вероят- 
ность появления цифры «7» в последовательности цифр, записы- 
ваемых данным испытуемым. 

Пример 5.8. В примере 3.3 для 42 студентов были определе- 
ны линейная регрессия социометрического сталуса на курсе (У) в 
зависимости от статуса в своей группе (Х): у = 22 + 18, а также 
безусловные средние арифметические M[Y] = 25 и МХ] = 3,34; 
стандартные отклонения o[Y] = 28,8 u o[X] = 9, 54; коэффициен- 
ты линейной корреляции rey = 0,63 и нелинейной детерминации 
Tye = 0,33 и 72/у = 0,477. Требуется проверить, удовлетвори- 
тельна ли линейная аппроксимация регрессии «у по 2», и, опреде- 
лив доверительные интервалы для M[Y] и ау/„, установить дове- 
рительную область теоретической регрессии социометрического 
сталуса на курсе в зависимости от статуса в своей группе. 

Проверка удовлетворительности аппроксимации сводится к про- 
верке значимости различий между наибольшим из коэффициентов 
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нелинейной детерминации и квадратом коэффициента линейной 
корреляции: 
п/у — 72, = 0,477 — 0, 397 = 0,08. 


По табл. 5.2 находим, что в зависимости от числа условных сред- 
них M(z/y), из которых вычислялся коэффициент детерминации 
7/y (их было 7), стандартная погрешность 


(nz yy — ту) = V0, 08:5 ~ 0, 13. 
По (5.14) вычисляем эмпирическое значение {-критерия: 
в = (Ели ~My): O(neyy — Thy) = 0,6, 


что меньше любого наименьшего теоретического квантиля tas 
Следовательно, гипотеза о линейности He отвергается (различия 
случайны). 

Определим далее доверительные интервалы для М(У) и ау]: и 
вычислим их минимальные и максимальные значения. Формулы 
стандартных погрешностей находим в табл, 5.2: 


o[M(Y)] = of ¥) : Ул = 28,8: У42 = 4,4, 


_ в(У) [1-г1, _ 28,8 /1—0,397 F 
us) = SOR) oa ау 0. 
Тогда ana и = 40 иа = 0,001 из табл. УШ Приложения 2 опреде- 
ляем lg, = 3,55 и находим 
[M(¥ )}min = 9,4, — [М(У)] нах = 40,6; 
[ayjelmin = 0,7, [ay/s]nax = 3,3. 


Чтобы построить доверительную область регрессии, нужно че- 
рез точки «центров рассеивания» (9,4; 3,34) и (40,6; 3,34) провести 
прямые с минимальными и максимальными угловыми коэффици- 
«нтами. Проще всего поступить следующим образом. Найдем до- 
полнительные точки, через которые пройдут искомые границы до- 
верительной зоны. Так как tga = Ду: Az = a,/,, то Ay = Azay/z. 
Выберем координату по х для искомых точек: 2 = 30; тогда 
Ar 0 — M(X) = 26,66 и, следовательно, координаты по у бу- 


и = [MV min + Aymin = 9,4 + 26, 66[ay/2]min = 28, 1, 
уз = [M(Y)]min + Avmice = 9,4 + 26, 66[ау ух] шах = 97, 4, 
уз = (M(¥))max + Аилы = 40,6 + 26, 66[ay/2]min = 59, 3, 
¥4 = [М(У) пах + Atimax = 40,6 + 26, 6[ау/ «шах = 128,6. 


Через найденные точки с координатами (у1;2), (у2;2), (уз;2) и 
(у4;2) и точки «центров рассеивания» проводятся, как показано 
на рис. 5.10, «граничные» прямые. Ограниченная ими область (на 
рисунке заштрихована) и есть зона, в которой с доверительной 
вероятностью 1 — а = 0,999 располагается теоретическая регрес- 
сия. Заметим, что мы построили максимально широкую область. 
Ограничиваясь меньшей доверительной вероятностью, можно су- 
щественно сузить и доверительную зону регрессии. Но выбор до- 
верительной вероятности — это не статистическая задача. 
Пример 5.9. Осуществим элементарный анализ коэффициен- 
тов корреляции статуса на курсе (Х1), нейротизма (X2) и эмоцио- 
нальной экспансивности (Хз) в первой выборке объемом 42 чело- 
века и в объединенной выборке объемом 99 человек (см. пример 
5.5). Будем считать коэффициент корреляции Ti; значимо отлич- 
ным от нуля, если для его 2;-преобразования справедливо, что 


51: (zig) > tooryn~r- 


Тогда, используя табл. 5.8, где приведены 
для рассматриваемых коэффициентов, вычисляем 


в(:;) =1: V42—3 = 0,16 — для всех 243, 
Jz12| : 0, 16 = 0,2342 : 0,16 = 1,46 < to,o1/40 = 2,70 — незначимо, 
t = |131 : 0,16 = 0,3095 : 0, 16 = 1,93 — незначимо, 
1 = |153] : 0,16 = 0, 2448 : 0, 16 = 1,53 — незначимо. 
Но для объединенной выборки оказывается: 
(24) =1: 99-350, 1 — для всех %;, 
, 1 & 2,65 > to,o1/100 = 2, 63 — значимо, 


преобразования 


212 
= |213 


0,1 & 2,24 — сомнительно, 
t = |233] : 0,1 & 3, 14 — значимо. 


Можно видеть, что увеличение объема выборки приводит к TO- 
му, что статистически незначимые оценки превращаются в ста- 
тистически значимые. Разумеется, это можно установить, лишь 
проводя дополнительные наблюдения. Таким образом, статисти- 
ческая незначимость оценок при малом объеме выборок еще ни о 
чем не свидетельствует, кроме того, что необходимы дополнитель- 
ные испытания. 

Чтобы избежать громоздких вычислений при проверке значи- 
мости коэффициентов в корреляционных матрицах высокого по- 
рядка, можно по квантилям {-распределения и 2-преобразованию 
(прямому и обратному) заранее вычислить критические значе- 
ния TY и, с которыми сопоставляются эмпирические коэффициенты 
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корреляции г;; с целью проверки их значимости. Такие критиче- 
ские значеният., „ дляа = 0,05и0, 01 и для4 < п < 1000 приведены 
в табл. У Приложения 2. Аналогично критические значения py, 
коэффициента ранговой корреляции Спирмена представлены для 
5 <п< 40 в табл. VI Приложения 2. 

На использовании {-критерия Стьюдента основывается метод 
расчленения корреляционного графа на части, отличающиеся по 
степени тесноты корреляций. Такие части, как упоминалось выше, 
называются корреляционными плеядами. Следовательно, корре- 
ляционнал плеяда — это некоторая часть исходного корреляцион- 
ного графа (или соответственно — корреляционной матрицы), по- 
лученная удалением некоторых дуг и вершин. 

Имеются два взгляда на содержательную интерпретацию кор- 
реляционных плеяд и несколько формальных методов их выделе- 
ния из корреляционного графа. Согласно первому взгляду корре- 
ляционная плеяда есть «пучок» переменных, относительно тесно 
коррелирующих друг с другом. Одна (или более) из переменных 
в пучке имеет наибольшее число тесных связей с остальными пе- 
ременными и рассматривается как индикатор, обусловливающий 
связи внутри пучка*. Согласно второму взгляду корреляционная 
плеяда — тоже «пучок» относительно тесно коррелированных пе- 
ременных, а причина этих корреляций находится вне данной си- 
стемы переменных — это некоторая латентная переменная, влия- 
ние которой и проявляется в корреляциях преимущественно дан- 
ного пучка**, Оба взгляда основываются на интерпретации факта 
парной корреляции либо как взаимодействия между самими кор- 
релирующими переменными, либо как следствия их взаимодей- 
ствия с некоторой неконтролируемой переменной. Нетрудно ви- 
деть, что эти взгляды не противоречат, а дополняют друг друга. 

Из формальных методов выделения корреляционных плеяд наи- 
более распространены методы расслоения (срезов) и методы фак- 
торного анализа. Здесь мы рассмотрим методы расслоения, 

Существо методов расслоения состоит в следующем. Величины 
коэффициентов парной корреляции гу; можно изобразить, как по- 
казано на рис. 5.11, в виде перпендикуляров длиной т;; к плоскости 
коррелируемых переменных Х:ОХ;. Проводя секущие плоскости 
через Ату;, начиная от некоторой достоверно отличающейся от 
нуля величины гии, можно расслоить «тело» корреляций на $ ча- 
стей, корреляции «внутри» которых и образуют s плеяд. Так, для 
сечений, показанных в общем виде на рис. 5.11, выделяются шесть 


“Терентьев П.В. Метод корреляционных пленд// Вести. Ленингр. 
ун-та. 1959. №9. 

*“Терентьев П.В. Дальнейшее развитие методь корреляционных пле- 
яд/ Применение математических методов в биологии. Л.. 1960. 
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Рис. 5.11. Расслоение корреляционной матрицы. 
+ (№) — секущие плоскости (границы слоев); |Ату,|— «шаг» рас- 
слоения; Tmin — минимальное значение коэффициента корре- 
ляции, достоверно отличающееся от нуля. 
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плеяд, которые в обычной форме корреляционных подграфов изо- 
бражены на рис. 5.12. 


G) ts 


Рис. 5.12. Корреляционные плеяды, выделяемые по методу 
расслоения. 
1—7 (2) < чл И") < ту < (2); HM —rmin < riy < (ИИ 
тама ть > —F(1); V—=r(1) ть, > 2) VI—=1(2) > ти. 


Вместо расслоения можно проводить отслаивание плеяд, после- 
довательно отсекая часть связей с гу; согласно неравенству |rij| < 
Ir(k)|, так что остаются лишь переменные, все более и более тес- 
но связанные, либо, наоборот, согласно неравенству |r,;| > |"(%)|, 
так что остаются переменные, все менее и менее тесно связанные. 
Заметим, что если расслоение рассматривать как аналог диффе- 
ренциальной функции распределения, то отслаивание аналогично 
интегральной функции. 

Существенным для техники выделения плеяд расслоением (или 
отслаиванием) является выбор начала отсчета min и определение 
«шага» |Arj|. Очевидно, что нет смысла выделять статистиче- 
ски недостоверные плеяды. Следовательно, во-первых, выделять 
плеяды можно лишь из числа гу;, значимо отличных от нули, и, 
во-вторых, коэффициенты «соседних» плеяд должны неслучайным 
образом отличаться друг от друга. Поэтому началом отсчета пле- 
яд должно быть критическое значение Ton» как оно определено 


выше (Гош in)» а «шаг» расслоения |Ar;;|, очевидно, следует 
определять по уравнению (5.16). 

Используя прямое (2) и обратное (7!) преобразования Фишера, 
можем определить для заданного объема выборки (п): 


где 
[во | = tay : Уп - 3, 
(6.17) 
ven-1, @<0,01; 
[dr] = 142", 
где 
ae (5.18) 


ven+n-1—2, а< 0,01. 
После этого границы слоев определяются формулами 
г(1) = ош + Аг и r(éi+1) = г) + Аг. (5.19) 


Очевидно, для фиксированного п можно статистически досто- 
верно выделить лишь 5 корреляционных плеяд: 


пы i} (5.20) 


Для удобства практического использования по формулам (5.17) — 
(5.20) вычислены для ряда п значения гии. |Ат| и r(i) при дове- 
рительной вероятности 1 —а = 0,99; они приведены в табл. XI 
Приложения 2. 

Пример 5.10. В табл. 5.10 представлены интеркорреляции 
одиннадцати переменных, тестируемых по методике Векслера. 
Эти данные получены усреднением (через 2-преобразование) вось- 
ми статистически однородных выборок по сто человек в возрасте 
от 18 до 25 лет, так чте объем объединенной выборки (п = 800) 
позволяет достоверно выделить пять корреляционных плеяд. 

Перед расслоением корреляционную матрицу целесообразно 
ранжировать. Для этого через 2-преобразование в исходной ма- 
трице вычисляются средние значения коэффициентов корреляции 
каждой переменной со всеми остальными (десятью): 


МГ = (М) *, 


где 


Таблица 5.10 


Исходная корреляционная матрица к примеру 5.10 
1— общая осведомленность, 2— понятливость, З— внимательность, 4— способность к обобще- 


нию, 5 


‘непосредственное запоминание (на цифрах), 6 — уровень овладения родным языком, 7— 


скорость овладения сенсомоторным навыком (кодирование символами), 8 — наблюдательность, 
Э— комбинаторная способность (к анализу и синтезу), 10 — способность к организации частей в 
осмысленное целое, 11 — способность к эвристическому синтезу. 


Tlepemex— 
ные [1 2 з 4 5 6 7 9 10011 | Mfriy} | Раиг 
1 1 0,537 0,438 0,623 0,282 0,647 0,371 0,485 0,371 0,363 0,336 | 0,454 | 1 
2 1 0,810 0,551 0,291 0,508 0,273 0371 0,363 | 4 
3 1 0,348 0,345 0,291 0,282 | 0,336] 7 
4 1 0,310 0,318 0,291 | 0,414 | 3 
5 0,254 | 11 
6 0,336 о, 345 0, 282 0,430 | 2 
7 0,388 0,254 0,245 | 0,310 9 
8 5 
9 6 
10 8 
и т |0,300 | 10 


Примечание. Подчеркиуты соответствующим образом влементы корреляционных плеяд, пред- 


ставленных 


рис. 5.13 и 5.14, кроме элементов IV плеяды. 


Табличе 5.11 


`Ранжоированная корреляционная матрица к примеру 5.10 


1 т bear 668] 0,576,486] 371 688 
2 6 1 0,872 0,508 | 0,405 1,398 0,405 0,345 0,345 0,282 ГО) 
з 4 110,422 40,31 

4 2 1 04 | 

5 8 10,397] 0,318 
6 9 1 0,345 to 
т 3 1 

8 10 

9 т 

10 и 

п 5 


ass! 0,3711 0,310 0,273 0,273 0,273 0,291 


=== 


0,371; 0,336 0,282 | 0,454 


1 0,5511 0,422 {0,310 0,345 0,318 0,318 0,291 0,273 | 0,414 


3631 0,310 за 216 | 0,363 


Lod 


Примечание. Контурами выделены достоверные слои, плеяды внутри которых представлены 


на рис. 5.13 и 5.14. 
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N — порядок корреляционной матрицы; (...)-\ — символ обратно- 
го 2-преобразования. Эти средние значения показывают степень 
связи остальных N — 1 переменных с +. Переставляя одноимен- 
ные столбцы и строки исходной корреляционной матрицы в соот- 
ветствии с убыванием рангов по M[rj;], получаем ранжированную 
корреляционную матрицу (табл. 5.11), в которой корреляции пре- 
имущественно убывают слева направо и сверху вниз. 

По табл. XI Приложения 2 длял = 800 находим значения rnin и 
границ r(i), после чего расслаиваем ранжированную матрицу, вы- 
деляя корреляционные плеяды внутри слоев (рис. 5.13), либо от- 
сламваем части корреляционной матрицы, выделяя объединения 
корреляционных плеяд для вышележащих слоев (рис. 5.14). 


АХ ах 


<\/ 


Рис. 5.13. Корреляционные плеяды, полученные расслоением ма- 
трицы интеркорреляций (табл. 5.11). 
Ir, > 0,607 -- плеяда образована переменными с теснотой связей 
выше средней; П—0,478 < r,, < 0,607 — плеяда из переменных со 
средней теснотой связей; Ш—0, 349 < ть; < 0,478 — плеяда объеди- 
няет переменные с теснотой связей ниже средней; [У —0,220 < г; < 
0,349 — плеяда из слабо связанных переменных; V—0,091 < rj < 
0,220 — плеяда объединяет более слабо связанные переменные. 
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Puc, 5.14. Корреляционные пле- 
илы, полученные отслаиванием. 
I—n, 2 0,607; И- и, > 0,478; 
Ш — ть, 2 0,349; плеяды 1У и V ие 
приведены из-за чрезмерного чи- 
cna связей. 


Содержательный анализ полученных плеяд выходит за пределы 
математической статистики. Но можно отметить два формальных 
показателя, способствующих содержательной интерпретации пле- 
яд, согласно первому из двух взглядов, рассмотренных выше. Од- 
ним существенным формальным показателем служит степень вер- 
шины, т.е. число ребер, примыкающих к вершине. Переменная с 
наибольшим числом ребер выступает в качестве «ядра» плеяды 
и может рассматриваться как индикатор остальных переменных 
(данной плеяды). Например, на рис. 5.13 в плеяде I индикатором 
служит переменная J, для плеяды | — переменная 2, для плеяды 
1 — переменная 9. В плеяде ПУ четко выделяются два групповых 
«ядра»: одно из переменных 7, 11, 10, а второе из переменных 
3, 5, 4, причем «межъядерных» ребер больше, чем «внутриядер- 
ных», поэтому данную плеяду нельзя рассматриваль как объеди- 
нение двух разных плеяд— это целостное образование. Другим 
существенным формальным показателем служит теснота связей. 
Переменная может иметь меньше связей, но более тесных в одной 
плеяде, и больше связей, но менее тесных в другой плеяде (напри- 
мер, переменная 4 в плеядах II и IV на рис. 5.13). 


Е-критерий Фишерв 


Если две случайные величины xy} и x3 имеют х?-распределе- 
ния с числом степеней свободы и! и и. соответственно, причем 
выполняется неравенство 


то отношение 
(5.21) 


зависит только от числа степеней свободы 1 и 12 и имеет F- 
распределение с плотностью, показанной на рис. 5.15. 


08 id 


44 


[2 


Рис. 5.15. Плотность Е-распределения. 
По оси ординат — плотность, по оси абсцисс — значения F. 
1-я = =6; 2—и = ии = 6; 35—и =6ии = 60. 


Квантили Fy/y, 1, рассматриваются как критические значения 
отношений величин вида (5.21) и служат для проверки статисти- 
ческих гипотез о сходстве (различии) двух дисперсий, о значимо- 
сти коэффициентов детерминации, об однородности ряда средних 
арифметических значений. Для а = 0,05, 0,01 и чисел степеней 
свободы и; — для числителя формулы (5.21) и и; — для ее знаме- 
нателя доверительные значения квантилей Ё-распределения пред- 
ставлены в табл. [Ха и 6 Приложения 2. 

Сравнение двух выборочных дисперсий осуществляется следу- 
ющим образом. Вычисляют эмпирическое дисперсионное отноше- 
ние (F,): 


при 4, = и2 -1, 


при п: $ п2, м =n) — 1, № =п2-1, 


где всегда выбирается О; > D2 и п! — объем выборки с Di, a 
пз— объем выборки с Оз. Лалее из табл. Ха и 6 Приложе- 
ния 2 выбирают квантиль Ё./„ „, и проверяют условие Fy < 
Ро,об/инниз — Дисперсии отличаются лишь случайным образом, или 
Е > Роль, — Отличия неслучайны. 

Значимость коэффициентов детерминации типа 72у,, 1 з..м Или 
72, и В? „5 _м можно проверять по {-критерию Стьюдента, рассмо- 
тренному выше. Но так как они, в сущности, представляют со- 
бой дисперсионные отношения, то считается лучшим проверять их 
значимость по Ё-критерию. Для любого из коэффициентов детер- 
минации эмпирическое значение Р-критерия находят следующим 
образом: 

п? (та — т) 
(1=9?)(m=1)' 
где 1? — любой из перечисленных выше нелинейных (линейных), 
простых (множественных) коэффициентов — детерминации; 
т — число переменных, исходя из которого вычислялся коэффи- 
циент детерминации 12; п— число значений каждой переменной 
(одинаковое для всех переменных); mn — общее число всех наблю- 
дений*. 

Если вспомнить, что коэффициент нелинейной детерминации 
ni), есть отношение дисперсии условных средних арифметических 
значений случайной величины И при условии, что другая слу- 
чайная величина 2 принимает ряд из т фиксированных значений, 
то нетрулно понять смысл проверки однородности ряда средних 
арифметических значений. Пусть имеется т выборочных средних 
арифметических My, М»...М;,..., Ми и требуется установить, из- 
меняются ли они от выборки к выборке (все равно, под действием 
контролируемых или неконтролируемых факторов). Тогда по ме- 
тодам, представленным в главе 3, вычисляют общее среднее зна- 
чение (М) этих средних арифметических, рассматриваемых в ка- 
честве условных средних: 


Ps (5.22) 


и определяют их дисперсию относительно общего м: 


м] = я умри — м2. 
jai) у=1 


*Если число значений неодинаково для разных переменных, тогда вместо 
mn общее число наблюдений определяется как ть; пу, где j = 1,2,....m— 
номер случайной переменной; п; — число наблюдавшихся ce значений. 
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Затем рассчитывают выборочные дисперсии Dj и среднее ариф- 
метическое из этих дисперсий: 


i< 
=== УЗ, 
с 73 


после чего вычисляют эмпирическое значение Е-критерия: 


в _ Ми - =) 
= Do(m — 1) . 
и осуществляют проверку аналогично тому, как показано выше 
° для сравнения двух дисперсий. Если т средних М; оказывают- 
ся статистически неоднородными, следовательно, можно ожидаль 
присутствия явной (при контролируемых факторах) или неявной 
(при неконтролируемых факторах) регрессионной зависимости. 
Пример 5.11. В примере 3.3 рассматривалась корреляцион- 
ная взаимосвязь между статусом на курсе (У) и в своей группе 
(Х). Были определены коэффициент детерминации my), = 0,33 и 
Условные средние арифметические значения статуса на курсе (см. 
табл. 3.11): My = —4; М; = 24; Мз = 31; Ма = 52. Требуется 
оценить, значима ли детерминация статуса на курсе статусом в 
группе, т.е. 72,, > 0, и (что в данном случае то же самое) одно- 
родны ли четыре указанных выборочных средних арифметических 
значения. 
По формуле (5.22) при тп = 42 ит = 4 получаем 


_ _0,33(42~ 4) 
°* (1=0,33)(4—1) 


(5.23) 


26,2. 


Аналогично по формуле (5.23) при 3". п; = 42, т = 4 и вычи. 
сленных в примере 3.3 D[M] = D[M(y/z)] == 275, 83 и Do = Doly/z] = 
563, 47 определяем 
= 275,88(42—4) go 
° 363, 47(4—1) ~9'* 


Заметим, что одинаковый результат получился потому, что фор- 
мула (5.23) является частным случаем формулы (5.22)*. 

Для проверки гипотез о значимости Nels и однородности че- 
тырех средних арифметических значений из табл. IX6 Прило- 
жения 2 для = m—1 = 3.4 v2 = т -—т = 38 находим: 


“Обе формулы приведены потому, что для проверки однородности не. 
скольких выборочных средних не нужно вычислять 7? и достаточно ограни. 
читься формулой (5.23). 
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Fo,01/3,40 = 4,31 < Е, = 6,2. Следовательно, различия между сред- 
ними не случайны, они должны считаться неоднородными; коэф- 
фициент детерминации статуса на курсе сталусом в своей группе 
является значимым. 

Если Р-критерий используется для проверки однородности не- 
скольких средних арифметических, то для проверки однородно- 
сти более чем двух дисперсий его применять нельзя. Для провер- 
ки однородности нескольких выборочных дисперсий при выборках 
неравного объема используется критерий Бартлетта, а в случае 
одинакового объема — более простой критерий Кохрана. 


Критерий Bapmaemma 
Пусть имеется т выборок объемомп; и с дисперсией П; каждая. 


Тогда отношение B/C, где 


= in 
B = 2,3026 | | Sn; -т) lgD— Уи, - Ир, |, 
jar f= 


Lyd; (5.24) 


распределено приблизительно как Хх?-распределение с m— | сте- 
пенями свободы независимо от nj, лишь бы все п; > 5. Следо- 
вательно, гипотеза об однородности всех О; принимается, если 
в/С < ХЗ 05 /т- п и отклоняется, если B/C > Ху м_1° Из урав- 
нений (5.24) можно видеть, что всегда C > 1, поэтому сначала вы- 
числяют В и сопоставляют с критическим значением \2,. Если 
В < Ха, то гипотеза об однородности принимается, если же нет, 
то приходится вычислять С. 

Пример 5.12*. Ученики шестого — одиннадцатого классов оце- 
нивались по тесту «числовые ряды» (табл. 5.12). Требуется опре- 
делить, изменяется ли дисперсия оценок при переходе от млал- 
ших классов к старшим, Иначе говоря, нужно проверить однород- 
ность дисперсий по критерию Бартлетта. Значения промежуточ- 
ных расчетов представлены в табл. 5.13. 


'См.: Clauss G., Ebner Н. Grundlagen der Statistik fiir Psychologen, Piida- 
gogen und Soziologen. Bertin, 1967. 


Таблица 5.12 
Исходные данные к примеру 5.12 


] Кльссы 
10-й | п-й 
18,0 | 23,0 
19,5 | 18,5 
23,5 | 18,5 
16,5 | 16,5 
22,0 | 19,5 
19,0 | 18,5 
15,0 | 18,5 
19,5 | 21,5 
25,0 | 19,5 
15,5 | 16,5 
21,0 | 20,5 
20,5 | 17,5 
17,0 
Оценки 21,5 
по тесту (24,) 23,0 
18,0 
18,0 
22,0 
16,5 
19,5 
17,0 | 22,0 
20,0 | 22,5 
20,5 | 19,0 
16,5 - 
16,5 | - 
20,0 | - 
=: = 502,5 | 447,5 
7 26 | 23 
Таблица 5.15 


К расчету критерия Бартлетта при неравных объемах выборок 


Общую дисперсию D можем определить либо по формуле (5.24), 
либо по формуле 


1 A(< 3 
Px ene (59-1). 

где обозначенные величины приведены в табл. 5.12 и 5.13: 

2Р=7,63 и IgD=0,8825. 
Тогда по формуле (5.24) 

B = 2, 3026(146 - 0,8825 — 126,7739) ~ 4, 77. 
Из табл. VII Приложения 2 находим для =т-1=5 
Х8 в/в = 11,1> В = 4,17, 


следовательно, гипотеза об однородности дисперсий может быть 
принята. 


С-критерий Korpana 


В. Кохран показал, что отношение максимально большой из вы- 
борочных дисперсий к сумме всех т сравниваемых дисперсий 


os Se (5.25) 


jar Dj 


зависит только от т и от числа степеней свободы и = n—1, гдеп — 
одинаковый объем выборок. В табл. Х Приложения 2 приведены 
квантили С-распределения Кохрана, вычисленные для а = 0,05 
и 0,01. Проверка гипотез осуществляется стандартным для всех 
критериев способом. 

Пример 5.13*. Требуется сравнить три варианта метода пре- 
подавания (А, Ви С), которые отличаются всего одним призна- 
ком — применением наглядного материала. Был проведен эксие- 
римент, состоявший в том, что для каждого из трех равных по 
объему случайных контингентов учеников из параллельных клас- 
сов преподавание определенного учебного материала осуществля- 
лось только по одному из указанных вариантов. В заключение 
была проведена контрольная работа, результаты которой оцени- 
вались в баллах. Первичные данные эксперимента представлены 
в табл. 5.14. Определим, однородны ли дисперсии оценок, полу- 
ченных учениками, обучение которых проводилось с различным 
использованием наглядного материала. 


*Cu.: Clauss G. Ebner Н. Grundlagen der Statistik fiir Psychologen, 
Padagogen und Soziologen. Berlin, 1967. 
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Таблица 5.14 
Исходные данные к примеру 5.13 


Метод А | Метод В | Метод С 

9 15 18 

и 16 14 

10 15 17 

12 10 9 

7 13 14 

Оценки в баллах т 14 17 
(2ijs¢=1,2,...,15)] 12 15 16 
10 7 15 

13 13 16 

и 15 8 

13 15 14 

и 14 10 

10 и 16 

12 15 15 

13 10 17 
8; 165 | 198 216 


Вычисляя любым известным способом дисперсии, получаем 
Da=2,7; Dp=6,6; Ос=9,4. 

Определяем по уравнению (5.25) 

ы 9,4 
 2,7+6,6+9,4 
Из табл. Х Приложения 2 длят =Зии = 16 (ближайшее большее, 
чем и = 14, значение) находим, что Со,оз = 0, 547 > С = 0,503, т.е. 
дисперсии можно считать однородными. 


G А 0,503. 


$}, ОСНОВНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ 
5.1.1, Метод максимального правдоподобия 


Выше были рассмотрены методы проверки статистических ги- 
потез с помощью специальных критериев. Однако наряду с «кри- 
териальными» методами в математической статистике имеются 
методы точечного и интервального оценивания, не использующие 
критериев в том виде, как это показано. К таким методам можно. 
отнести и метод максимального правдоподобия. 

Этот метод, предложенный Р. Фишером, служит для точечной 
оценки любых параметров генеральной совокупности по выборке 
объемом п и состоит в следующем. Пусть случайная величина X 


имеет функцию распределения известного вида, определяемую не- 
известными параметрами 6), 65,...,0;,...,0м, которые необходимо 
оценить по выборке значений 21,22,.--,2i,---,2n, где п— объем 
выборки. Тогда вероятность появиться в выборке любому значе- 
нию 2; зависит (для данного закона распределения) только от со- 
вокупности из N конкретных значений параметров 8;; обозначим 
эту вероятность 


Р(т 91, 92,---, On). (5.26) 


Вероятность совместного появления в выборке п наблюдавшихся 
значений 2х, обозначим ее 


п м 
Е | Г =, Г % |, 


1 j=l 


очевидно, является произведением вероятностей вида (5.26) и на- 
зывается функцией правдоподобия *: 


п м п м 
| П =, 4%) = ЦР |=. (6% (5.27) 
i=) 2=1 i=l 


Jinn упрощения вычислений на практике чаще используется лога» 
рифм функции правдоподобия 


п м 
log Е = Slog P, | 21, [|6 |, (5.28) 
im jel 


причем в зависимости от обстоятельств логарифмирование про- 
водится в натуральных (In), десятичных (Ig) или двоичных (log,) 
логарифмах. 

Смысл отыскания оценок для параметров @; состоит в том, что- 
бы принять в качестве оценок такие значения всех бу, при которых 
для выборочных значений 2; функции (5.27) или (5.28) обратились 
бы в максимум. Математически это задача отыскания экстремума, 
функции многих переменных**, и в общем виде она не всегда мо- 
жет быть решена. К счастью исследователей психологического, 
педагогического и других смежных профилей, для наиболее упо- 
требительных функций распределения и их параметров эта задача. 

*Знах (V2, — это знак пересечения (логического умножения) вссх елемен- 
тов от 1,2,....п. Аналогично знаку суммы $), и произведения [], он 
используется для сокращения записи. 

**Отыскание экстремума функции N переменных заключьется в том, что 
ее дифференцируют в частных производных по каждому из аргументов, по- 
лучая N уравнений, которые приравнивают к нулю и совместно решают. В 
‘результате и определяются значения оценок 9; ,02,...,8N- 


раз и навсегда решена, и можно пользоваться готовыми результа- 
тами. А именно: максимизация функции правдоподобия достига- 
ется при оценке вероятности частостью, при оценке моментов ге- 
неральной совокупности выборочными моментами и т. д., согласно 
приводившимся формулам. При этом все рассмотренные оценки 
состоятельны, в большинстве случаев эффективны и достаточны, 
но могут быть смещенными (см. табл. 5.1). Заметим также, что 
многие формулы рассмотренных выше критериев могут быть по- 
лучены с использованием метода максимального правдоподобия; в 
частности, формулы (5.9) и (5.11)*. В качестве особой разновидно- 
сти метода. максимального правдоподобия можно рассматривать 
метод оценки апостериорной вероятности гипотез, предложенный 
задолго до Р. Фишера английским священником Т. Бейесом. 


5.1.2. Метод Бейеса 
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Особенностью этого метода является использование априорных 
вероятностей истинности (или ложности} гипотез, для того чтобы 
на основе апостериорных оценок вероятностей событий, интере- 
сующих исследователя, оценить (в виде апостериорной вероятно- 
сти) истинность или ложность гипотез, т.е. уточнить априорную 
информацию опытным путем. 

Пусть P(A) и Р(Л)— заранее известные (априорные) вероят- 
ности истинности и соответственно ложности гипотез (см. фор- 
мулу (5.2)). Производя опыт, благодаря которому (апостериори) 
определяются условные вероятности Р(П/И) — приема истинной 
и Р(П/Л) — приема ложной гипотезы, можем оценить вероятность 
принятия истинной гипотезы 


Р(ПИ) = Р(И)Р(П/И) = Р(П)Р(И/П) (5.29) 

и вероятность принятия ложной гипотезы 
Р(ПЛ) = Р(Л)Р(П/Л) = Р(П)Р(Л/П), (5.30) 
где полная вероятность принять истинную или ложную гипотезу: 
Р(П) = Р(ПИ) + Р(ПЛ). (5.31) 


Тогда из равенств (5.29) и (5.31) можем определить апостериорную 
вероятность истинности принимаемой гипотезы: 


Р(И)Р(П/И) _ _Р(И)Р(ШИ) 


Р(И/П) = РП) — = PIM) + РПЛ) 


(5.32) 


"Cm: Аткинсон Р., Бауэр Г., Кротерс Э. Введение в математи- 
ческую теорию обучения. M., 1969. 


Аналогично из равенств (5.30) и (5.31) можем определить апосте- 
рчорную вероятность ложности принимаемой гипотезы: 


Р(П)Р(П/Л) 


Р(П/П) = Ри) + РПЛ) 


(5.33) 
Заметим, что сумма левых и соответственно правых частей ра- 
венств (5.32) и (5.33) равна единице, так как принятие истинной и 
принятие ложной гипотезы образуют полную группу событий. 

Равенства (5.32) и (5.33) называются формулами апостериорных 
(условных) вероятностей принятия гипотез. Точно так же мож- 
но построить формулы для Р(И/О) и Р(Л/О}— апостериорных 
(условных) вероятностей отклонения гипотез. Все эти и подоб- 
ные им формулы для произвольного числа гипотез известны под 
названием формулы Бейеса: 


Р(Н:)Р(А/Н,) 
SF 
Deer PCH) P(A/Hi) 


где P(H;/A)— апостериорная вероятность истинности (ложности) 
гипотезы H; при условии опыта A; Н; — {-я принимаемая (отклоня- 
емая) гипотеза; N — полная группа несовместимых гипотез; A— 
опыт, дающий информацию об истинности (ложности) 1-й гипо- 
тезы; Р(Н;)—априорная вероятность {-Й гипотезы; P(A/Hi)— 
апостериорная вероятность принятия (отклонения) 1-Й гипотезы 
в опыте А; 77, P(Hi)P(A/Hi) = Р(А) — полная вероятность при- 
нятия (отклонения) в опыте всех гипотез. 

Поясним использование метода Бейеса для частного случая 
проверки двух гипотез (или, что то же самое, — проверки истин- 
ности или ложности одной гипотезы) по формулам (5.32) и (5.33) 

Пример 5.14. Согласно результатам многочисленных исследо- 
ваний только около 80% людей пригодны к профессии оператора. 
(летчик, диспетчер энергетического, химического и других произ- 
водств и т. д.). Для отбора специалистов-операторов проводятся 
пробы на профессиональную пригодность. При этом, допустим, 
человека считают пригодным к данной операторской профессии, 
если он выполняет 95% проб (специальных заданий), и непригод- 
ным, если он выполняет только 50% проб. Таким образом, дано: 
гипотеза Н: — пригоден и Р(Н1) = 0,8; гипотеза Нз — непригоден 
и P(H2) = 0,2; апостериорные вероятности принять гипотезы: 
Р(П/Н!) = 0,95 и Р(П/Н2) = 0,5. Спрашивается, каковы вероят- 
ности Р(На/П) и Р(Нз/П) того, что среди выполнивших 95% проб 
окажутся люди, действительно пригодные к профессии оператора 
и соответственно непригодные к ней? 


P(Hi/A) = (5.34) 
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Пользуясь формулой (5.32), определяем 


РАН,РИИН!) =: 
Р(Н,)Р(П/Н!) + Р(Н>)Р(П/Н?) — 
= 0,8 -0,95 
© 0,8-0,95+0,2-0,5 
Точно так же, пользуясь формулой (5.33), определяем 


_ РР = 
Р(Н:)Р(П/Н) + Р(Н?)Р(П/Н:) — 

_ 0,2-0,5 

~ 0,8.0,95+0,2.0,5 


P(H,/M) = 


= 0,88. 


Р(Нз/П) = 
0,12. 


Можио видеть, что действительно опыт позволяет уточнить 
априорную информацию. В этой связи допустим, что проведе- 
но новое испытание для людей, отобранных в первом опыте как 
профессионально пригодных. Пусть снова апостериорные вероят- 
ности Р(П/Н\) = 0,95 и Р(П/Н») = 0,5. Спрашивается, какова 
вероятность прошедшим и второе испытание оказаться пригодны- 
ми к операторской деятельности? 

Очевидно, целесообразно использовать информацию, получен- 
ную после первого испытания. Поэтому вместо априорных веро- 
лтностей Р(Н1) = 0,8  P(H2) = 0,2 используем апостериорные 
вероятности гипотез Р(Н,/П) = 0,88 и Р(Н»/П) = 0,12. Тогда по 
формуле (5.34) вычисляем 

p(n /ni п) = РУТИНУ _ 

Vier Р(НИ/ПР(ТИН!) 
0,88 -0,95 


2088-0950. 2.05 0,93. 


Можем видеть, что благодаря новому опыту апостериорная ве- 
роятность принятия истинной гипотезы еще увеличилась. Заме- 
тим, однако, что увеличение после второго опыта оказалось мень- 
ше, чем после первого опыта. Если бы последовательно проводи- 
лись все новые и новые опыты, то искомая апостериорная вероят- 
ность увеличивалась бы, асимптотически приближаясь к единице 
как к своему пределу, при бесконечном увеличении количества 
опытов. Причем за каждое асимптотически уменьшающееся при- 
ращение апостериорной вероятности исследователю пришлось бы 
расплачиваться асимптотически увеличивающимся до бесконеч- 
ности числом опытов. В этой связи возникают две существенные 
проблемы: первая — какое число наблюдений (опытов} необходи- 
мо и достаточно провести, чтобы определить искомый параметр 


(функцию) с требуемой степенью точности, и вторая — как мож- 
но распорядиться последовательным накоплением информации от 
опыта к опыту, чтобы по возможности уменьшить число наблюде- 
ний. 


$11. Классический метод определения параметра | функции! с заданной точностью 


Пусть по выборке объемом п требуется оценить параметр ec 
априори задаваемой точностью. Мерой точности является отно- 
сительная ошибка (первого рода} а, которую, как обычно, полага- 
yor равной 0, 05 или 0,01, где 


9-6" 
= 5. 
a=, (5.35) 
9 — выборочная оценка параметра 0". 
Мерой точности также является и абсолютная ошибка А: 
A=|a-6"|=|0-0"|. (5.36) 


В соответствии с определением доверительного интервала по фор- 
мулам (5.1) и (5.15) абсолютная ошибка A задается следующим 
образом: 

A=o(8" ta, (5.37) 
где 0(0")— стандартная погрешность параметра, определяемая 
формулами из табл. 5.2. В частности, для среднего арифмети- 
ческого значения М[Х] 


в] 
=, (5.38) 


o(M(X)] = Se 


rae с[Х] — стандартное отклонение, оцениваемое Ha выборке объ- 
емом п. 
Подставляя (5.38) в (5.37) и преобразуя, получим 


wm ыы, (5.39) 


где п— объем выборки, необходимый и достаточный для оценки 
среднего арифметического с точностью до а; Д — заданная иссле- 
‘дователем абсолютная ошибка определения среднего арифметиче- 
ского значения по формуле (5.36) при условии выбранного по (5.35) 
значения а; о?[Х] = ВХ] — выборочная дисперсия; 4, = 1,96, 
если а = 0,05, и ta,vas, = 2,58, если а = 0,01. 

Пример 5.15. Известно, что для любого субтеста шкалы Векс- 
лера (тип WAIS) среднее арифметическое значение шкальной оцен- 
ки М = 10, а дисперсия D = 9. Определим число наблюдений, 
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необходимое для оценки среднего арифметического значения для 
любого субтеста этой шкалы выборочным путем, чтобы относи- 
тельная ошибка не превышала 5% (т.е. чтобы а = 0,05). 
Абсолютная ошибка по формуле (5.36) равна: A = 0,05-10= 0,5 
(шкальной оценки). Тогда по формуле (5.39) находим 
9. 1,962 
n= Va = 139. 
Следовательно, необходимо и достаточно иметь B выборке 139 че- 
ловек. 

Аналогичным путем из формулы (5.37), подставляя в нее соот- 
ветствующую формулу стандартной погрешности искомого пара- 
метра (нужная формула выбирается из табл. 5.2) и преобразуя, 
находят формулу объема выборки, необходимого и достаточного 
для оценки искомого параметра с заданной ошибкой а. Например, 
требуется оценить вероятность P, пользуясь частостью р. Диспе- 
рсия ошибки о?(р) = p(1—p) : п, следовательно, по (5.39) получаем 
для а = 0,05 


(1 Ро 
ap 
где р— предварительно оцененная по выборке частость. 

Пример 5.16. В примерах 1.2 и 5.7 рассматривалась оценка ве- 
роятности появления цифры «7» при свободном записывании цифр 
испытуемым. Частость р («1») = 0,108 при объеме выборки 1300. 
Спрашивается, какой нужен был бы объем выборки, чтобы опре- 
делить вероятность P (47») с ошибкой в 5%? в 10%? 

Для а = 0, 05 по формуле (5.40) находим 


1,96?(1 — 0,108) 
0, 0025 - 0, 108 


Аналогично для а = 0,1, учитывая, что to,1/oo = 1,645, находим 


_ 1,645?(1 — 0, 108) 
~ ~~ 0,01-0, 108 


Таким образом, при n = 1300 частость р(«7») = 0,108 измерена 
более, чем с 10%-Й относительной ошибкой. 

Рассматриваемый классический метод фактически создан для 
случайных выборок из однородных совокупностей. А как опреде- 
лить объем выборки из гетерогенной совокупности? Если априори 
известно распределение вероятностей элементов гетерогенной со- 
вокупности, то в соответствии с классической процедурой можно 
осуществить типический отбор (по схеме независимых испытаний) 
следующим образом. 


n ; (5.40) 


— 12691 (наблюдений). 


= 2235 (наблюдений). 


Будем рассматривать гетерогенные совокупности как объеди- 
нения гомогенных частей. Тогда простая гетерогенная совокуп- 
ность может быть представлена как состоящая из непересекаю- 
щихся гомогенных частей (рис. 5.16, а), а сложная — как состоящая 
из пересекающихся или пересекающихся и непересекающихся ча- 
стей (рис. 5.16, 6). 


а 


Puc. 5.16. Гетерогенные совокупности. 

«— простая rereporenuas совокупность как объединение своих непере- 

секающихся частей: Ay + Аз + Аз + Ag + As + Ав; б— споживя гете- 

рогениая совокупность как обобщение своих пересекающихся и непере- 

секающихся частей: AZ Аз О Аз О As О 44 О As О 4. 

Пусть простая гетерогенная совокупность состоит из § гомоген- 
ных частей, вероятности появления которых Р,, где} = 1,2,..., 8, 
известны и в сумме равны единице (5 — это полная группа собы- 
ti). Тогда из определения величины {-критерия Стьюдента по 
формуле (5.13) следует: 


2 
v= X20, 


х/к 2 


Полагая и = пу, 2? = A? = a? P? их! = Р(1- ВР), получаем для 
оценки {-й вероятности 


™ 
и для всех з вероятностей 


Ns ЕВ “1-P 
ee ea 
is isl 


где n; полностью соответствует уравнению (5.40). 


ыы (1 — Р)/а?Р, 


‘аля 
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Аналогично рассуждая, можем представить сложную гетеро- 
генную совокупность как состоящую из з частей, повторяемых т 
раз, т.е. как матрицу с $ строками и т столбцами, имеющую всего 
[ = тз пересечений. Тогда. 


(5.41) 


где N — общий объем репрезентативной типической выборки, не- 
обходимый и достаточный для оценки многомерного распреде- 
ления вероятностей изучаемой гетерогенной совокупности; р: 
выборочная частость ij-ro пересечения; niz = ру М — частота 
пересечения, необходимая и достаточная для оценки вероятности 
Р.; с ошибкой не больше а; пз; рассматривается так же, как объем 
случайной выборки из части гетерогенной совокупности с пересе- 
чением множества фиксированных свойств. 

Пример 5.17. В примере 5.3 было получено совместное распре- 
деление статуса (Х\), нейротизма (Хз) и эмоциональной экспан- 
сивности (Хз) на выборке в 99 человек (табл. 5.7). Спрашивается, 
какой объем выборки требуется для оценки этого распределения 
с ошибкой не более 5%? 

Пользуясь частостями рут из табл.5.1 и формулой (5.41), осу- 
ществим вычисления, как показано в табл. 5.15. Результат на пер- 
вый взгляд ошеломляющий: N ~ 260400 наблюдений. Однако иного 
и быть не может, так как речь идет об определении функции много- 
мерного распределения, которое из опыта, как указывалось, опре- 
делять нелегко именно из-за необходимости очень больших объе- 
мов выборки. Покажем, что для оценки отдельного параметра 
многомерной совокупности требуются выборки меньшего объема*. 

Таблица 5.15 


Вычисление объема выборки из сложной гетерогенной 
совокупности к примеру 5.17 


Код | Величина 


Pijm | рат Пот, 
Pin 0,03 7812 
Pia 0,10 26040, 
Pia Bh 

Piz , 

Ра her 

Paia 

рэ 0,03 

рзаз | 0,28 


*По той простой причине, что отдельный параметр является неполной 
количественной характеристикой совокупности, как мы всегдь ото подчер- 
кивали. 


Пример 5.18. В разделе 4.3.2, оценивая количественные ха- 
рактеристики трехмерной системы случайных величин, мы уста- 
новили, что при выборке в 42 человека средние арифметические 
значения и дисперсии статуса на курсе (Х1), нейротизма (Хз) и 
эмоциональной экспансивности (Хз)соответственно равны: 


M(X1) = 3,34, М(Х)=13,2, M(Xs) =8,9; 
D(X1)=91, D(X2)=24, D(X) = 404. 
Спрашивается, какого объема, следует взять выборку, чтобы оце- 
нить средние арифметические значения статуса, нейротизма и экс- 

пансивности с ошибкой, не большей а = 0,057 


Сначала вычислим по выборочным данным абсолютные ошибки 
и их квадраты: 


A[M(X1)] = 0,05.3,34=0,167, Aj = 0,167? == 0,028; 
A[M(X2)] = 0,05-13,2=0,66, A} = 0,667 = 0,44; 
A[M(Xs)] = 0,05 -8,9 = 0,445, A} = 0,445? = 0,2. 


Теперь, учитывая выборочные дисперсии, по формуле (5.39) опре- 


деляем 91-1 96? 
Ny = Se = 12485, 
№= wae = 209,6 © 210, 
Ns = we = 7760. 


Можно видеть, во-первых, что, действительно, для оценки сред- 
него арифметического (отдельного параметра) необходимо почти 
в двадцать раз меньше опытов, чем для оценки трехмерного рас- 
пределения (предыдущий пример). Во-вторых, чем меньше вели- 
чина оцениваемого параметра по сравнению с дисперсией, тем 
больше требуется опытов для оценки с заданной точностью. B 
нашем случае фактически требуется исследоваль максимально 
М, = 12485 человек. При этом остальные переменные (Хз и Хз) 
будут в среднем измерены с более высокой, чем Хи, степенью точ- 
ности. Если же попыталься сэкономить на числе опытов, ориенти- 
руясь на минимальное № = 210, то среднее арифметическое м[х!] 
окажется оцененным с весьма большой ошибкой: 


а{М( 1), М = №] = А, : М(Х!) = o[M(X1), М = №]: М(Х!) = 


1 91 


= 2161969 0,4. 


Таким образом, чтобы добиться измерения одноименных пара- 
‘метров для нескольких разнородных случайных величин с точ- 
ностью не меньше заданной, необходима выборка максимального 
объема (из числа требуемых). 

Как показано, классический метод определения необходимого 
и достаточного объема выборки требует значительного числа на- 
блюдений. Однако при определенной организации исследования 
можно обойтись меньшим числом наблюдений, не проигрывая в 
точности. Такая организация предполагает в общих целях про- 
схтирование пропорциональной выборки по модели генеральной 
совокупности, а в частных — при изучении изменчивости средних 
арифметических — использование средств дисперсионного анали- 
за и математического планирования эксперимента (глава 6), при 
проверке статистических гипотез относительно отдельных пара- 
метров — последовательной процедуры по А. Вальду. 


}.1 4. Метод проектирования репрезентативной выборки по модели совокупности 
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С очевидностью репрезентативна выборка, распределение ча- 
стостей в которой равно распределению вероятностей в генераль- 
ной совокупности: 

3B) = aPC). (5.42) 
Из этого равенства следует, что маргинальные частоты выборки 
Ле. должны быть пропорциональны соответствующим частотам 
генеральной совокупности: 


откуда перестановкой средних членов пропорции получаем 


ЛЬ. п 
Fe = (5.43) 
УЕ. 
где п и N — объемы выборки и генеральной совокупности. Таким 
образом, маргинальные частоты и объем выборки пропорциональ- 
ны частотам и объему совокупности, имеющей конечный объем. 
Этим обусловлено название — пропорциональная выборка. Отме- 
тим, что это — так называемая квотная выборка, квоты (доли, ча- 
стости, проценты) элементов которой не произвольно установле- 
ны, а выбраны равными (или приближенно равными) веролтно- 
стям генеральной совокупности. 
Чтобы определить критический, необходимый и достаточный, 
объем выборки по (5.43), следует ввести еще одно существенное 


условие: 


ыыы 22. (5.44) 


Это вызвано тем, что необходимы хотя бы два измерения, для того 
чтобы оценить воспроизводимость результатов, вычисляя среднее 
арифметическое и дисперсию измерений. Так как fnin = "Pmins 
то из условий (5.43 и 5.44) естественным образом следует оценка, 
критического объема репрезентативной выборки: 


n° =2: (Phe. wlminy (5.45) 
где, на основе равенства (5.42), 


[Phe wlmin = | РЁ. wlmin- 


Оценив критический объем, вычисляют частоты выборочного 
распределения: 


п"Р(ГС) = 9 (В) = {Fe wh (5.46) 


которое представляет собой проехт для создания реальной выбор- 
ки. Этот проект в дальнейшем реализуется следующим образом. 

Jina каждого маргинала (пересечений градаций признаков, ин- 
тервалов квантования) составляется список лиц, обладающих нуж- 
ным сочетанием признаков, который в 2-3 раза превышает проект- 
ную маргинальную частоту. Из этого списка случайным отбором 
(например, по жребию) формируются подсписки, удовлетворяю- 
шие проекту F(B), объединение которых в базисе модели образует 
теперь уже реальный план нескольких краткосрочных гомогенных 
выборок или резерв для долгосрочной панели. 

Разумеется, если истинное генеральное распределение неиз- 
вестно, то за исходное для (5.42) принимается стохастическая мо- 
дель генеральной совокупности. В качестве примера использу- 
ем модель трехмерной совокупности «пол, экстра—интроверсия и 
нейротизм», рассмотренную в $ 5.1: 


эн эн ия ин 


0,072 0,008 0,224 ви) 


_м 
PAB) PEP AA Che 0,012 0,324 0,216 


Onpenensem no условию (5.45) оценку критического объема выбор- 
ки: п*=2:0,008 = 250 (человек). По (5.46) вычисляем проектные 
выборочные частоты: 


eH eH HH ин 


18 2 56 24 
Як 9%. x) = творя эк) =% (19 за ей 
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Для оценки воспроизводимости (надежности) результата тре- 
буется повторять испытания, значит, необходимы повторные вы- 
борки. В психологии с этой целью используют расщепление выбо- 
рочных данных, например на четные и нечетные вопросы анкеты 
или задания теста. Но таким путем нельзя выявить направленную 
изменчивость и получить эмпирическую зависимость. Для этого 
нужно иметь серию не менее чем из трех, а лучше — пяти выборок. 
Поэтому продолжим пример. 

Заменим равенство (5.42) на приближенное, округлив совмест- 
ные частности до десятых долей: 


эН эн HH ин 


р 0,1 00 02 01 
Рота a) = тв) (1 0.0 03 the 


и снова оценим критический объем выборки: 7° 2:0,1 = 20 
(человек). Теперь проектное выборочное распределение частот 
таково: 


эн эн ИН ин 
Рю тв) =" (3 = 3 i) 


Получилось, что в нем отсутствуют две категории людей обоего 
пола — с редким сочетанием экстраверсии и нейротизма. Поэто- 
му нужно предусмотреть в проекте по 2 человека с сочетанием 
этих свойств и таким путем увеличить объем выборки до 24 чело- 
век. Реализация проекта остается той же. Заметим, что в резуль- 
тате допущенного отклонения от пропорциональности возможно 
пятисерийное выборочное исследование с общим объемом вдвое 
меньше против первоначального. В то же время каждая из пяти 
выборок объединяет в себе две части — веролтную из двадцати 
человек и маловероятную из четырех человек, которые можно ис- 
следоваль и использовать как вместе, так и по отдельности. 


11. Метод последовательной проверки статистических гипотез 


Этот метод, предложенный А. Вальдом, изучен лишь для неко- 
торых законов распределения и применяется, главным образом, 
для оценки двух вероятностей и средних значений*. Существо по- 
следовалельного (секвенциального) анализа состоит в следующем. 


*Хотя в принципе может быть применен для сравнения любых двух па- 
раметров с известной функцией распределения, что требует, однако, специ- 
альной разработки. 


Вальд дополнил альтернативное поведение при классической 
проверке гипотез третьим исходом: продолжить испытания, если 
нет достаточных оснований принять одну из гипотез (см. рис. 5.6, в), 
и предложил использоваль так называемое отношение правдопо- 
добия, которое является отношением двух функций правдоподобия 
(5.27), одна из которых соответствует гипотезе Но, а другая— 
альтернативной гипотезе Hy. 

Пусть имеется некоторая выборка значений х; случайной вели- 
чины X(i = 1,2,...,п), для которой известна плотность вероятно- 
сти /(г,0), зависящая от рассматриваемого параметра 6. Пусть, 
далее, проверяются гипотезы: Но, состоящая в том, что @ = фи 
Ни, состоящая в том, что 9 = 91. Тогда отношение правдоподобия 
в соответствии с (5.27) можно записать так: 


_ А py Лав) 
b= = Пе) 


или в логарифмической форме: 
ЩЕ = lg Py — Ig Po = 8,61) — Лк, 66). 
‘1 
Этот логарифм отношения правдоподобия вычисляется после ка- 
ждого 1-го испытания и сравнивается с доверительными предела- 
MU, которые определяются исходя из выбранных значений веро- 
ятностей ошибок первого (а) и второго (Й) рода. 

Доверительные пределы нетрудно найти по следующим сообра- 
жениям. Если исходы проверки гипотез независимы, то условные 
вероятности принятия истинной и ложной гипотез, а также откло- 
нения истинной и ложной гипотез равны: 


l-a=8, (5.47a) 
а=1- 2. (5.476) 
Тогда из (5.47а) определяем нижний предел: 


а из (5.476) — верхний предел: 


Acad. 
— 


1< 


Логарифмируя эти пределы и сопоставляя их с величиной лога- 
‘рифма отношения правдоподобия на каждом i-M «шаге» последо- 
вательного анализа, осуществляем выбор поведения: если Ig [, < 
18[8/(1-а)}, то принимается гипотеза Но, если 1 L > 1#((1—8)/а], то 
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принимается гипотеза Ни, если lg{8/(1—a)] < Ig L < Ig[(1—8)/a], то 
продолжаются испытания — до тех пор пока не будет принята од- 
на из двух проверяемых гипотез. При этом нет нужды каждый раз 
вычислять lg [ и значения пределов. Специальными преобразова- 
ниями для основных функций распределения получены линейные 
‘уравнения для нижнего (то) и верхнего (ти) пределов: 


mo(n)=ho+kn и тип) = +kn, 


где п— последовательно увеличивающееся число испытаний, a 
значения k,ho и hy представлены в виде формул в табл. 5.16. С 
использованием этих формул последовательная процедура осуще- 
ствляется следующим образом. Выбираются 6 и 6, как правило, 
по априорным соображениям. Затем выбираются а и В. Вычисля- 
ются k, ho why. Далее по одному (или группами в единиц) осуще- 
ствляются испытания, и для каждого i-ro испытания (i = 1,2,...,п 
или i = 31,83...,3;..., зи) накапливается сумма 


n n [4 
m= x=] Da], (5.48) 
1 1 \5=1 

которая сопоставляется со значениями Mo и ти, вычисляемыми 
при п = i, как показано на рис. 5.17. Одна из гипотез принимается, 
как только точка с координатами [mj,i] пересечет соответствую- 
щую линию. 


мы myshekn 


mjam,(t) 


m,(t) >> mol) 


mi <то(!) 
n 


Puc. 5.17. Графическая интерпретация проверки гипотез при последо- 
вательном анализе. 

По оси абсцисс — число испытаний (я = i); по оси ординат — значения 
т, определяемые по формуле (5.48). Обльсть тиц < mo(i) соответствует 
принятию гипотезы Но, область т; > mi(i) соответствует принятию 
гипотезы Hy, между ними — область продолжения испытаний. 


Таблеца 5.16 


Формулы для определения границ областей поведения при 
проверке гипоте» по методу последовательного анализа: 


Вид распределения. Угловой Свободный член для | Свободный член для 
коэффициент (К) гипотезы Ho(ho) гипотезы Hi(hi) 
 Биномивльное (сравниваются две ЕЙ ee ee 
вероятности) Е igh — lg = leh — eae 
Нормальное (сравниваются два My(X) + Ma(X) в D(x) __ ize 
средних арифметических) 2 My(X) - Мо(Х) 1-а | МХ) - Мо(х) ^® 


rcnonemnnansnce (<pannnanioren лох 


ig в: _ вый 
ya MM) № -№ м -№ 
значения параметра А = TO 


Примечание. Во всех случаях подсчитывается т = ON, 2 = р (Lhe =) где для биномиального распределения 


iy = {07 mm coOrarue ue wonmienoch, |, для нормального м экспоненцияльного рыспределений ху —вто наблюдаемое в 


1 если событие появилось 
{5-Й группе из опытов (з > 1) змачение случайной величины Х. 


Таблица 5.17 


Формулы для априорной оценки среднего числа шагов (v) 
последовательной процедуры Banna 


Вид "Для принятия Jaa принятия 
распределения | чнуль»-гипотезы,если | чальтернативной» гипотезы, гипотез 
она истинна M(v, Ho) сели она истинна M(v, Hi) м(ь) 
[ОХ тылы сия Aig 25 + (1 - ye SF 
Биномиальное Е = _ = - 
Pulp +(1-Poigi=p | Pile + (1— Adiga 
= Ba 18 1 a 1-1 a 1-8 
tonne | OO | Soe = 
м 7 Сы 
- 18 - 1-2 - 22 
Dncnonensmanseee | C—Mertetoets® | Alerts to—anelgt | вы, 
eR Se (is) 
= hgh, 2 ti) 
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Подробнее остановимся на ограничениях к использованию про- 
цедуры Вальда. Во-первых, последовательный анализ хорошо 
разработан и доказан для сравнительно простых однородных со- 
вокупностей, полученных в независимых испытаниях. Во-вторых, 
нужно быть уверенным в устойчивости закона распределения со- 
вокупности. В-третьих, следует предварительно установить эф- 
фективность последовательной процедуры по сравнению с клас- 
сической. Хотя Вальд показал, что при последовательной про- 
цедуре одна из гипотез будет в конце концов достоверно приня- 
та, все же число наблюдений может оказалься больше, чем при 
классической процедуре. Чтобы до опыта оценить эффективность 
последовательного анализа, необходимо, пользуясь априорными 
данными, определить число наблюдений, требуемое по классиче- 
ской процедуре (№), и число «шагов» последовательного анализа, 
(). 

Число шагов и является случайной величиной, зависящей от 
степени «близости» гипотез (разница 0; — 4%), от величин а и В 
и от вероятности истинности (ложности) гипотез. На практике 
по априори выбранным а, В и соотношению значений параметров 
Oo и 8; оценивают математическое ожидание числа шагов, за ко- 
торое окончится последовательный анализ: M(v, Но) — для приня- 
тия гипотезы Но, если она истинна, M(v, Н!) — для принятия ги- 
потезы Ну, если она истинна, и М(у) — в наихудшем случае, когда 
6 = 0,5(6: + %). Формулы для априорной оценки этих величин 
приведены в табл. 5.17 

Эффективность последовательного анализа оценивается по фор- 
муле 

Do =1-M(v): М. (5.49) 


Очевидно, что при Эф > 0 последовательную процедуру стоит 
предпочесть классической, если позволяют указанные выше огра- 
ничения. Заметим, что они снимаются, если исследование ведется 
с применением психометрических шкал и методов*. 

Пример 5.19. При измерении интеллекта взрослых с помощью 
вышеупомянутой шкалы Векслера получаемые оценки нормально 
распределены со средним арифметическим значением 100 единиц 
и стандартной ошибкой не более 2 единиц 19. Лля выборки из 
десяти восемналцатилетних школьников (8 — 10-го классов) было 
установлено, что МПО] = 102 и D[IQ] = 38. Однако из предыду- 
щих исследований известно, что у восемнадцатилетних взрослых 
10 > 100. Спрашивается, сколько испытаний следует провести, 


*Генкин А.А., Бодров В.А. Применение одного статистического ал- 
торитма разделения входных ситуаций на классы для определения профес- 
сиональной пригодности// Вопросы психологии. 1967. № 1. 


чтобы проверить Но — является ли средний уровень интеллекта. 
нормальным (Mo(IQ) = 100), или H; — он значимо выше средней 
нормы (М: (10) > 102)? 

Согласно классическому методу оценки параметра с заданной 
степенью точности, по формуле (5.39) находим при a = 8 = 0,05 


.1.962 
= #37 (человек). 


Для выполнения последовательного анализа вычислим логариф- 
мы пределов: 

1[8/(1 —а)] = 1g(0, 05 : 0,95) = —1, 2790; 

Ig[(1 — )/а] = 15(0,95 : 0,05) = 1,2788. 
Далее по формулам из табл. 5.17 для нормального распределения 


получаем 
MUv, Hg) = 19219) 4.0506 = 15 2788 BS (1279) i081: aTHS = (человек), 
738 
мен) = 201.279) + 0,95 1.2788 1) (еловек), 
38 
M(v) = 29-12788 _ 24.3243 оо weronen), 


5 38 


Определяем для N и M(v) эффективность последовательного ана- 
лиза по формуле (5.49): 


17 
Эф=1- 55 0,54. 


Следовательно, имеет смысл воспользоваться последовательным 
анализом. 

По формулам из табл. 5.16 для нормального распределения вы- 
числяем значения k, ho и hy: 


38, 0,05 
Е=0,5(102+100) = 101, № = Flea ae = —24,3, 
38, 0,95 
i= ув © 24,3 


Таким образом, получаем уравнения границ: 
то = 101n — 24,3; т, = 101n + 24,3. 


Далее, не прибегая к графическому изображению, реализуем 
последовательное, по уравнению (5.48), накопление суммы ту, вы- 
числение значений границ mo(i) и т! (1) и их сопоставление, как 
показано в табл. 5.18. В результате уже при п = 14 оказывает- 
ся, что M14 > ти14), и, следовательно, можно принять гипотезу. 
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Таблица 5.18 
Реализация последовательной процедуры к примеру 5.19 


den] 2; | m= Diy ai | то = 101 - 24,3 | my = 1011 + 24,3 


т fin 11 76,7 125,3 
2 |106 217 1777 226,3 
з | 95 312 278,7 327,3 
4 | 101 413 379,7 428,3 
5 | 100 513 480,7 529,3 
в |100 613 581,7 630,3 
7 | 98 7 682,7 731,3 
s | 97 808 783,7 832,3 
9 | 90 898 884,7 933,3 
10 | в 987 985,7 1034,3 
и | 113 1100 1086,7 1135,3 
12 | 116 1216 1187,7 1236,3 
13 | ит 1333 12887 1337,3 
4 |14 1447 1389,7 1438,3 


Н:—уровевь интеллекта восемнадцатилетних школьников боль- 
ше среднего IQ шкалы Векслера. 

В заключение отметим, что использование вместо «единичных» 
групповых наблюдений оказывается полезным для ускорения за- 
вершения последовательного анализа, но при этом неизбежен про- 
игрыш в эффективности. 


ГЛАВА |, ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА И МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ 
ЭКСПЕРИМЕНТА 


# |. ПОНЯТИЕ О ДИСПЕРСИОННОМ АНАЛИЗЕ 


$1.1, Сущность дисперсионного анализа 


Допустим, имеется несколько переменных факторов, которые 
либо классифицированы, либо упорядочены, либо, наконец, изме- 
рены. Требуется установить, влияют ли эти факторы на изучае- 
мую переменную (случайную величину или случайную функцию). 
Исследование влияния переменных факторов на изучаемую пере- 
менную по дисперсиям называется дисперсионным анализом (ДА). 

Пусть изучается случайная величина Х, о которой известно, 
что при определенном комплексе условий Х имеет генеральную 
дисперсию Do[X]. Требуется проверить, влияет ли на Х некото- 
рый фактор (условие) А, до сих пор не принимавшийся во внима- 
ние. Проводится серия наблюдений переменной Х при условии 
А (при действии фактора А) в дополнение к предыдущему ком- 
плексу. условий. В результате получаем выборку из п значений Х 
(21,22, 23,...,2n), имеющую дисперсию D[X]. Очевидно, что если 
фактор А не влияет на X, то Б[Х] = Бо[Х] — в идеальном случае. 
Практически это не так, но различие не должно превосходить слу- 
чайного (с заданной степенью надежности), что легко определяет- 
ся по Р-критерию Фишера. Иначе говоря, если D[X] =: Do[X]—B 
пределах случайных флюктуаций — можно считать, что либо фак- 
тор А не влияет на X, либо это влияние несущественно при данном 
объеме (п) выборки. 

Если D[X] > Do[X], и это не случайно, то приходится признать, 
что фактор А влияет на переменную Х. Тогда, считая действие 
фактора А независимым от других условий, можем написать: 


D[X] = Do[X] + DalX], (6.1) 


rae Do[X]— дисперсия, обусловленная случайными влияниями He- 
контролируемых условий; Da[X]— дисперсия, характеризующая 
влияние фактора А на изучаемую переменную Х. 


Влияние фактора А на переменную Х может быть различным. 
Здесь выделяются три случая. Первый случай: фактор А влияет 
только на среднюю величину Х, тогда Da[X] есть характеристика 
рассеивания средних значений переменной Х под влиянием фак- 
тора А. Второй случай: фактор А влияет только на рассеивание 
значений X, т.е. на Do[X], тогда Da[X] есть некоторая «добавка» 
кРо[Х], выражающая степень влияния фактора А. Третий случай: 
фактор А влияет и на M[X], ина Оо[Х], тогда Da[X] суммирует эти 
влияния. 

Если имеет место второй или третий случай, то влияние факто- 
ра А можно учесть, применяя параметрические и непараметриче- 
ские критерии, меры корреляции, уравнения регрессии. Если же 
имеет место первый случай, то наряду с рассмотренными метода- 
ми применяют дисперсионный анализ. Иначе говоря, ДА исполь- 
зуется лишь в первом случае. Его мы и будем рассматривать в 
этой главе. 

Пусть теперь в дополнение к фактору А требуется испытать 
влияние фактора В. Здесь возможны два варианта: 1) факторы А 
и В независимы и 2) факторы А и В зависимы. Рассмотрим эти 
варианты отдельно, 

1) Факторы А и В независимы. Проводится новая серия наблю- 
дений над переменной Х при условии, что кроме A на М[Х] дей- 
ствует фактор В. В результате получаем выборку из п значений 
переменной X, имеющую дисперсию О*(Х]. Очевидно, что 


D*[X] = D[X] + DalX], (6.2) 


где Ов[Х] — доля дисперсии, обусловленная действием фактора B. 
Если влияние фактора В значимое (согласно Р-критерию и приня- 
тому доверительному уровню), то член Ов(Х] существенно отли- 
чен от нуля. Подставляя (6.1) в (6.2), получаем для двух факторов 
AnB: 

D°[X] = Do[X] + Da[X] + Da[X], (6.3) 


где в левой части — общая дисперсия выборки, а в правой части 
члены Ол(Х] и Ов[Х] выражают долю рассеивания средних зна- 
чений M[X] переменной Х под влиянием факторов А и В соответ- 
ственно; член Do[X] выражает случайные флюктуации переменной 
под влиянием всех других (не А и не В) факторов (условий) опыта, 
и называется остаточной дисперсией. 

Заметим, что в (6.2) член D[X] выражал влияние (в общем слу- 
чайное) всех других, кроме В, факторов (в том числе и А); это 
тоже остаточная дисперсия. Вообще под остаточной дисперсией 
понимается часть общей дисперсии выборки, которая не втодит в 
долю дисперсии по данному фактору или группе факторов. 
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2) Факторы А и В зависимы. Тогда помимо трех слагаемых в 

правой части (6.3) появляется еще одно слагаемое: 

D*[X] = Do[X] + Da[X] + Рь[Х] + Das[X]. 
Слагаемое Dap[X] выражает долю общей дисперсии D*[X], об- 
условленную совместным влиянием факторов А и В на матема- 
тическое ожидание изучаемой переменной Х. 

Обобщим сказанное о двух факторах на произвольное количе- 
ство факторов. Пусть на случайную переменную Х с генеральной 
дисперсией Do[X] влияет т факторов: Ai, A2,...,Am. Тогда, если 
эти факторы независимы попарно и в совокупности, то 

D[X] = 25%] + Da,(X] + Da,[X]+---+Da,[X], (6.4) 
где Б[Х] — общая дисперсия выборки, полученной при воздей- 
ствии указанных факторов Aj, Аз,..., Ат; 0о[Х] — генеральная дис- 
персия, которую мы здесь принимаем за остаточную дисперсию. 
Члены Da,[X] (при i = 1,2,...,m) выражают парциальное дей- 
ствие соответствующих факторов на математическое ожидание пе- 
ременной Х. Если факторы попарно зависимы, то к (6.4) добавля- 
ются справа слагаемые, выражающие совместное действие всех 
возможных пар факторов; число таких слагаемых определяется 
числом сочетаний из т по 2. Если факторы к тому же зависимы 
по три, по четыре и т. д. — по т, то добавляются еще члены, вы- 
ражающие долю в общей дисперсии сочетаний факторов по три, 
по четыре и т.д. 

На основе сказанного можно видеть, что общая дисперсия вы- 
борки, полученной при влиянии т факторов, определяется как 
дисперсия суммы т + 1 случайных величин, где дополнительная 
случайная величина отображает влияние меучиты ваемыг условий 
(ей соответствует остаточная дисперсия). При этом для незави- 
симых факторов общая дисперсия есть линейная сумма факторных 
и осталочной (всего т + 1) дисперсий, а для зависимых (в общем 
случае) сюда добавляется сумма. дисперсии всех факторных вза- 
имодействий по два, по три и т. д. — по т. 

Таким образом, сущность ДА состоит в том, чтобы представить 
общую дисперсию в виде суммы дисперсий, обусловленных влия- 
нием контролируемых и неконтролируемых условий опыта и, оце- 
нивая дисперсионные отношения, определить меру влияния кон- 
тролируемых условий (факторов) на средние значения изучаемой 
переменной. 


#11. Предпосылки дисперсионного анализа 


Как мы видели, одной из предпосылок ДА является ‘использо- 
вание Р-критерия Фишера для проверки значимости влияния фак- 
торов. Поскольку Р-критерий основывается Ha предположении о 


нормальном распределении генеральных совокупностей, из кото- 
рых взяты выборки, то это обстоятельство весьма существенно 
для возможности применения рассматриваемого метода. в целом. 
Дисперсионный анализ следует применять, когда известно (или д0- 
казано), что выборки нормально распределены. Это первое важное 
условие грамотного применения ЛА. В противном случае истин- 
ность выводов ничем не обоснована и не гарантируется. 

Второй предпосылкой ДА является, как показано, выделение 
факторных и остаточной дисперсий из общей дисперсии. Чтобы 
это выделение было возможным, необходимо, чтобы остаточная 
дисперсия не изменялась от опыта к опыту под влиянием контро- 
лируемых и неконтролируемых факторов. В противном случае 
изменения остаточной дисперсии не позволят однозначно решить, 
что вносят в рассеивание средних данных контролируемые фак- 
торы. Поэтому прежде чем применять дисперсионный анализ, не- 
обходимо убедиться в том, что дисперсия выборочных серий не 
меняется однонаправленно от серии к серии. Если такое измене- 
ние происходит, необходимо стабилизировать дисперсию* и лишь 
потом применять ЛА. 


}.\ 3. Задачи дисперсионного анализа 


Основная задача ДА состоит в том, чтобы из произвольно- 
го числа факторов, которые могут (как предполагается априори) 
влиять на изучаемую переменную, выделить сравнительно неболь- 
шое количество факторов, влияющих наиболее существенно. Эта 
основная задача ДА, смотря по обстоятельствам, конкретизиру- 
ется по-разному. В частности, иногда выделяют два этапа ЛА. 
Первый связан с оценкой общего, недифференцированного влия- 
ния одного или нескольких факторов на среднее значение изучае- 
мой переменной. Второй этап состоит в исследовании специфиче- 
ского, парциального действия факторов. 

Оценка общего влияния факторов позволяет сравнительно бы- 
стро минимизировать первоначально обычно большое количество. 
факторов. В результате первого этапа ДА многие из априори вы- 
бранных факторов отбрасываются как несущественные. Оставше- 
еся небольшое количество факторов затем исследуется подробно, 
для того чтобы определить «вес» каждого из факторов и фактор- 
ных комбинаций. 

Таким образом, конкретизация основной задачи ЛА может идти 
в трех направлениях: во-первых, оценка общего влияния одного или 
‘нескольких факторов, во-вторых, оценка парциального влияния от- 


*О методе стабилизации дисперсии см. в кн.: Пустыльних Е.И. Ста- 
тистические методы анализа и обработки наблюдений. М., 1968. С.167-168. 
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дельных факторов и, в-третьих, оценка парциального влияния раз- 
личных комбинаций факторов. Отметим, что последнее позволяет 
обоснованно осуществить выбор между линейной или нелинейной 
аппроксимациями регрессии. 

До сих пор мы предполагали генеральную дисперсию Do[X] из- 
вестной и оценивали действие нового фактора, сравнивая две вы- 
борки: выборку с новым фактором и выборку без него. Но обыч- 
но имеется всего одна выборка, которая состоит из наблюдений, 
полученных при различных сочетаниях нескольких факторов, о 
влиянии которых отсутствует априорная информация. Требуется 
по этой выборке определить генеральную дисперсию и оценить 
парциальное и совместное действия всех исследуемых факторов. 
Тогда практически задача состоит в «расщеплении» общей дис- 
персии выборки на слагаемые, выражающие влияние факторов и 
остаточную дисперсию. После этого требуется проверить, зна- 
чимо ли влияние факторов по отдельности и в комбинациях, и 
на основе результатов проверки отобрать факторные комбинации, 
существенно влияющие Ha исследуемую переменную, для их даль- 
нейшего детального изучения. 


4, Виды дисперсионного анализа 


Планирование и проведение эксперимента, а также схема обсче- 
та данных существенно зависят от числа исследуемых факторов, 
от количества градаций (уровней) каждого из них, от количества 
повторных (параллельных) испытаний, от того, все или только не- 
которые сочетания факторов на всех уровнях исследуются. В со- 
ответствии с этим выделяют следующие виды ДА. 

В зависимости от количества факторов (k): однофакторный 
(& = 1), двухфакторный (k = 2), трехфакторный (k = 3) ит.д.— 
многофакторный (мультифакторный, при произвольном k) ДА. 

В зависимости от количества градаций (т) каждого из факто- 
ров выделяют ДА на двух-, трех-, четырех- и т. д. уровнях. В этой 
связи обычно говорят об уровнях организации (планирования) k- 
факторного эксперимента, т.е. о ДА km, где & — число факторов, 
а т— число их градаций. Обычно стремятся, чтобы т было для 
всех k одинаково, это значительно упрощает ДА. 

В зависимости от того, есть повторные испытания при каждом 
сочетании факторов на каждом уровне или они отсутствуют, вы- 
деляют ДА без повторных (параллельных) испытаний и ДА с по- 
вторными испытаниями. В последнем случае также стремятся, 
чтобы число повторных испытаний (п) для всех kim; было одним 
и тем же. Но в общем случае оно может aa переменным, и это 
несколько усложняет расчеты. 


Наконец, в зависимости от того, все ли сочетания факторов на 
всех уровнях (kjmj) используются в исследовании или же часть 
таких сочетаний пропущена, выделяют полный факторный и дроб- 
ный факторный ЛА. 


+1, ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 


РИ. Схема расчета при одинаковом количестве повторных испытаний 


Здесь будем рассматривать принципиальную схему такого ДА, 
когда имеется всего один фактор А, исследуемый на произволь- 
ном количестве (т) уровней. При этом, в сущности, не важно, 
какие значения принимает фактор А на каждом из рассматривае- 
мых уровней, т.е. не важно, как эти уровни количественно опре- 
делены, лишь бы это было недвусмысленно. Одним из уровней 
может быть и отсутствие фактора А. Сначала рассмотрим ЛА 
при одинаковом количестве параллельных испытаний на каждом 
из уровней. 

При одинаковом количестве параллельных испытаний мы име- 
ем схему эксперимента т x п, где т— число уровней фактора 
A;(j = 1,2,3,...,m) и п— количество параллельных испытаний на 
каждом j-M уровне. Результаты этой схемы табулируются, как 
показано в верхней части табл. 6.1. 

Прежде всего необходимо убедиться в стабильности дисперсий 
по уровням, применяя критерий Бартлетта или Кохрана. Если 
‘дисперсии нестабильны, их нужно стабилизировать. Дальнейшая 
процедура состоит в разложении общей дисперсии совокупности. 
на части, соответствующие рассеиванию внутри уровней и ме- 
жду уровнями, т.е. надо определить в явном виде уравнение (6.1). 
Для этого необходимо вычислить и проанализировать соотноше- 
ние определенных сумм квадратов, показанных в нижней части 
табл. 6.1. 

Общая дисперсия выборки, представленной в табл. 6.1, опреде- 


ляется как 
1 we 
DIX] = ут LLew- 


j=l ist 


(6.5) 


Разложим двойную сумму в формуле (6.5) на составляющие ее 
части, одна из которых выражает рассеивание внутри уровней 
(столбцов табл. 6.1), а другая— рассеивание между уровнями. 


Таблица 6.1 
Исходная таблица однофакторного ДА при одинаковом количестве 
повторных испытаний 
_— 
Уровни (j) фактора A 
(7 =1,2,3,...,m) 

Аз . 
Homepa (i) el] tee 
повторных 22: = Zam 
испытаний за за 23m 

(@=1,2,3,...)n) N=mn 
яз |... | eum 
Dh Fy Sa . Sm Dyer Sy = Der Dhar 2H 
M[z,] ==; Е i wna! Em ЕДУ, = 
= М] 
Зы, Dh th | Dash |e | Da ee Dye Die 2, 
" = a msn 
(Dh 25)* =F $ 5 > Sin Epa $F = Ops (Lhe es)? 
3 3 2 5 
= = Soi. © sr 


Отредактировал и опубликовал Ha сайте 


Это разложение представлено следующим уравнением: 


Ув -# = УЗ =} +5 - =). 
i=1 


у 7 j=l 


Преобразуя члены этого уравнения и вводя обозначения, получа- 
ем рабочие формулы для вычисления сумм квадратов отклонений: 


n m 


уд jalisi 


2 
a SH eure LEH LE (Eo) ‚ (6.6) 
j=1 Vel 


jist у 


У, -5' = ‘> (Ss) -м 


jai “= 


Из уравнений (6.6) легко видеть, что всегда 
9 = 9. +9^- (6.7) 


Теперь, чтобы получить соответствующие дисперсии, нужно ра- 
венство (6.7) почленно разделить на Число степеней свободы. Но 
прежде чем идти дальше, нам придется разобраться в одной рас- 
пространенной ошибке. 

Создатель дисперсионного анализа Р. Фишер предложил вычи- 
слять дисперсии с учетом их числа степеней свободы, а именно: 


valet 
D.[X] mam)? (6.8) 


“11 @^__ @ 
DalX] пт | -1 m(n—1))° 
При таком расчете дисперсий общая дисперсия есть средняя ариф- 


метическая случайной и факторной дисперсий, взвешенных по чи- 
слу степеней свободы: 


pix} тр од (69) 


При т > 2ип> 2 дробные множители перед D.[X] и Da[X] в 
уравнении (6.9) всегда меньше единицы, т.е. всегда, 


D[X] < ВХ] + Da[X], 


и основное уравнение дисперсионного анализа — уравнение (6.1) — 
оказывается нарушенным. Заметим при этом, что общая диспер- 
сия D[X] = =9-т вычисляется правильно. Следовательно, по ме- 
тодике Фишера всегда получаются завышенные значения D,[X] и 
Da[X]*. К сожалению, методика Фишера излагается почти во всех 
руководствах по математической статистике. Учитывая это, мы 
сначала будем рассматривать для примера метод Фишера, а затем 
излагать ДА так, чтобы основное уравнение (6.1) не нарушалось. 

Результаты ДА всегда представляют в виде таблицы, где ука- 
заны вариативность значения сумм квадратов отклонений (соглас- 
но уравнениям (6.6)), количество степеней свободы, оцениваемые 
дисперсии, а также (часто) граничное значение Р-критерия и до- 
верительная вероятность. Результаты ДА по методике Фишера 
представлены в табл. 6.2, В табл. 6.3 показаны результаты ДА. 
по исправленной методике вычисления дисперсий. Можно видеть, 
что различия между этими методиками, как и отмечалось, затра- 
гивают только слособ вычисления дисперсий и порядок проверки 
дисперсионного отношения, но не затрагивают основной процеду- 
ры расчета сумм квадратов отклонений. 


Таблица 6.2 
Табулированные результаты однофакторного ДА по методу Фишера. 
при одинаковом количестве повторных испытаний на всех уровнях 


Bapua- | Суммы | Кол-во | Средние |Оцениваемые| Значение 
` тивность| квадратов | степеней | квадратов | компоненты | Р-критерия 
отклонений| свободы [отклонений| дисперсии 

Между 

уровня- 9^ 
ми (фак- 
торная) 
Внутри 
уровней % 
(остаточ- 

ная) 

'Общья 9 


“Авилов В.А. Дисперсионный анализ // Методика и техника статисти- 
ческой обработки первичной социологической информации. M., 1968. 
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Общее количество степеней свободы для вычисления всех дис- 
персий в табл. 6.3 одинаковое: mn — 1. Тогда искомые дисперсии 
определяются следующими уравнениями: 


(6.10) 


Легко видеть, что в уравнениях (6.10) сохранены равенства (6.1) 
и (6.7), тогда как по Фишеру сохранено лишь равенство (6.7), a 
основное равенство ДА (6.1) нарушено. 


Таблица 6.3 


Табулированные результаты однофакторного ДА по исправленному 
методу при одинаковом количестве повторных испытаний на всех 


уровнях 
Bapna- | Суммы | Кол-во | Оцени- Значение (Вероятность 
тизность| квадратов [степеней| ваемая | Р-критерия  |ошибки вто- 
отклонений свободы дисперсия! рого рода. 

Между < 0,01 
уровня- Qn mn-1] DalX] 

ми (фак- IF, = Pol x или 
торнья) 

Внутри 850,05 
уровней Q тп-1| Do[X} 

(случай- 
ная) 


Общая а mn-1| 0} 


По Фишеру сначала определяют дисперсионное отношение оце- 
ниваемых компонент дисперсии, а затем вычисляют сами диспе- 
рсии (см. табл. 6.2). По исправленной методике ДА сначала 
непосредственно из сумм квадратов отклонений вычисляют вы- 
борочные оценки дисперсий и лишь потом рассчитывают диспе- 
рсионное отношение непосредственно через Da[X] и Do[X], вычи- 
сленные по формулам (6.10). При этом, естественно, величину F- 
критического следует определять по таблицам Р-распределения 
для того жё числа степеней свободы, что и по Фишеру: для суммы 
дисперсий в числителе т — 1, а для знаменателя тп — т. Если 


отношение pfyy(Do[X] + nDa[X]) < Р-критического, то влияние 
фактора А принимается как несущественное*. Тогда в качестве 
оценки генеральной дисперсии вместо величины П,[Х] можем при- 
нять общую дисперсию D[X], которая обусловлена только случай- 
ными флюктуациями внутри и между уровнями. Если значение 
pzpry(Do[X] + nDa[X]) > Р-критического, то следует отбросить 
гипотезу о несущественном влиянии фактора А и принять альтер- 
нативную гипотезу о существенном его влиянии. 

Пример 6.1. Применим ДА к результатам оценки трех методов 
преподавания, различающихся только использованием наглядно- 
го материала (см. пример 5.13). 

По данным, приведенным в табл. 5.14, вычислим промежуточные 
переменные (в общем виде показанные в нижней части табл. 6.1)— 


‘табл. 6.4. 
Таблица 6.4 
Промежуточные данные 
для однофакторного ДА к примеру 6.1 
Метод | Метод | Метод 

A B С | М=т=3.15=45 
S,= Dib, ки | 165 198 216 Der Sy = 579 
Si 1853 | 2706 | 3242 11 Die: 22, = 7801 
# 27225 | 39204 | 46656 | ST3_, S? = 119085 
3 2 3 
и 1815,0 | 26136 | 3110,4| 53., 12 = 7539,0 


По уравнениям (6.6) вычислим суммы квадратов отклонений. 
Далее проведем расчет сначала по методу Фишера. Результаты 
его представлены в табл. 6.5. 

Можно видеть, что при критическом значении F для числа сте- 
пеней свободы 2 и 42 и для доверительной вероятности 0,01 


Е =1,15 > Foo1;2/42 = 5,15, 


Не следует забывать, что такой вывод справедлив только для выборки 
того объема (т Х п), который был изучен. При большем количестве испы- 
таний можем получить противоположный результат, и влияние фактора А 
придется оценить как существенное. 
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т.е. различие значимо. Гипотезу об одинаковой эффективности 
трех методов преподавания, отличающихся степенью использова- 
ния наглядных материалов, нужно отклонить и принять противо- 
положную. 


Таблица 6.5 


Результаты однофакторного ДА по методу Фишера 
при одинаковом п к примеру 6.1 


Вариа- Суммы | Кол-во | Средние | Оцениваемые | Значение 
тивность | квадратов | степеней | квадратов | компоненты | Е-критерия 
отклоне- | свободы | отклоие- | дисперсии 
ний ний 
`Между 15Da[X]+ 
уровнями 89,2 м 44,6 +Do[X] 

Внутри 
уровней 262,0 42 6,24 Do[X] 
Общая 351,2 ча - - 


Теперь можем вычислить Da[X], которая, как оказалось, неслу- 
чайным образом отличается от нуля. Согласно уравнениям (6.8) 


DalX] = (44,6 — 6,24); 2, 56. 


Таким образом, можем записать основное уравнение JA: 
D[X] = Do[X] + БАХ}, 
где Do[X] = 6,24; Da[X] = 2,56 и должно быть D[X] = 6,24+2,56 = 


8,8. 
Вычислим О[Х], согласно уравнению (6.8) и данным табл. 6.5: 
DIX] = =. 351,2 = 1,98, 
Можно видеть, что основное уравнение ДА при вычислениях по 
Фишеру не выполняется: D[X] < Do[X] + Da[X]*. 
Выполним теперь расчет дисперсий и дисперсионного отноше- 
ния по исправленному методу. Дисперсии будем определять по 


*Не случайно в таблицах результатов ДА всегда отсутствуют значения 
общей дисперсии. 


уравнениям (6.10) для тп — 1 = 44 степеней свободы. Результа- 
ты приведены в табл. 6.6. Можно видеть, что основное уравнение 
дисперсионного анализа выполняется: общая дисперсия в точно- 
сти равна сумме факторной и остаточной дисперсий, 


Таблица 6.6 


Результаты однофанторного ДА по исправленному методу 
при одинаковом п к примеру 6.1 


 Вариативность | О, Е 
Факторная 

5254152003 6,12 
Случайная 262,0 
Общая 351.2 Fhouaya = 8,15, 


т.е. различие значимо 


Дисперсионное отношение определим по Фишеру: 


pa ВЫХ +" 
7 в] * 

Как видно из табл. 6.6, при вычислении по исправленной мето- 
Ake дисперсионное отношение меньше, чем при вычислении по ме- 
тоду Фишера (6, 12 < 7,15). В данном примере значимое различие 
сохраняется. Но важно отметить, что при близких к критическому 
значениях F методика Фишера может привести к отбрасыванию 
верной нулевой гипотезы и к принятию ложной альтернативной 
гипотезы, т.е. вероятность ошибки второго рода больше, если 
расчет вести по Фишеру. 


1.1.1. Схема расчета при разном количестве повторных испытаний 


При неодинаковом количестве повторных испытаний схема рас- 
чета несколько усложняется. Имеем план эксперимента: 5.7; пу, 
где п; — объем выборки при j-M уровне фактора А. 

Результаты эксперимента табулируются, так же как и в пре- 
дыдущем случае (табл. 6.1), но добавляется еще одна строка для 
значений п;. Несколько видоизменяются формулы (6.6) для рас- 
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чета сумм квадратов отклонений. Они теперь имеют вид 


тп; 


о-в Sia-s(EEs)_ 


i= 


ив = 4 > 1 ($e) ‚ ви) 


уже i=1 


бит “(5 ) (5) 


j=l j=1 у 


где 


т 


Ecau пользоваться методом Фишера, то в качестве оцениваемых 
компонентов дисперсии имеем 


94 (>>) DalX] + вых, 


jel 


Qo 


m(n -1) 


“ia {(3 Es) basis 4a] (6.12) 


j=l 


= Do[X] 


Ниже мы будем для расчета дисперсий пользоваться исправлен- 
ными методом, а дисперсионное отношение вычислять по Фишеру. 

Пример 6.2. Используем ДА для оценки влияния образова- 
тельного уровня (и возраста) школьников 6-11-х классов на ре- 
зультаты по тесту «числовые ряды» (см. пример 5.12). Первичные 
данные приведены в табл. 5.12. Промежуточные данные для расче- 
та сумм квадратов отклонений, согласно уравнениям (6.11), пред- 
ставлены в табл.6.7. Суммы квадратов отклонений, количество 
степеней свободы, дисперсии и дисперсионное отношение приве- 
дены в табл. 6.8. 

Для вычисления дисперсионного отношения используем форму- 
лу (6.12). Расчет в табл. 6.8 показывает, что Ё = 20,56. Заметим, 
что вычисления по методу Фишера дают значение Р = 22,5, весь- 
ма завышенное. 


Таблица 6.7 


Данные для расчета сумм квадратов отклонений по уравнениям (6.11) 


к примеру 6.2 


Компоненты сумм 


в уравнениях (6.11) 


my Didy Fy = 2539,0 
N=152 
Jer Deda 24, = 44385, 1 


Dob (LM eu) = 


Классы 
eit Tit si эй 10H 
363,0 376,5 389,0 460, 5 502,5 = 
"; a7 25 26 25 26 
5100,5 | 5033,2 | 6018,0 | 8650,8 | 9874,8 - 
а (57 Р 
+ (TR, =) 4880,3 | 5670,1 | 5820.0 | 8482,4 | 9711,8 


= 43271, 4 


Таблица 6.8 


Результаты однофакторного ДА (по исправленному методу ) 
при разном количестве повторных ис: 


 Вариативность 


9, 


Факторная 


Случайная 


Общая 


860, 1 


1973,8 


5,70 


7,37 | № = 


р п, = 25,3 


25,3-5,7047,37 _ 


7,37 ~ 
151,58 


= + & 20,56 


7,37 
spas =3,14< В, 
различие значимо 


Сравнение с Р-критическим при доверительной вероятности 
Р = 0,99 и количестве степеней свободы для оцениваемых компо- 
нентов дисперсии (соответственно 5 и 146) показывает, что разли- 
чие значимо. Нулевая гипотеза должна быть отклонена, и следу- 
ет принять гипотезу о существенном влиянии уровня образования 
(и возраста) школьников 6 — 11-х классов на результаты по тесту 


«числовые ряды». 


1.1. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 


1 |, Схема расчета при отсутствии повторных испытаний 
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Основное уравнение ДА при двух факторах А и В, алии 
как предполагается априори, на средние значения изучаемой пе- 
ременной X, в общем случае выглядит так: 


D[{X] = Da[X] + Da[X] + Рав(Х] + Do[X], 


где Da{X]—komnonent общей дисперсии (D[X]), sbyexonneants 
парциальным влиянием фактора А; Ов[Х] — компонент общей лис. 
персии, обусловленный парциальным влиянием фактора Bi 
Оль(Х] — компонент, обусловленный совместным влиянием (в: 

имодействием) факторов A и В; О.[Х] — остаточная дисперсия. 
Член Dap[X] удается определить лишь при наличии повторных 
испытаний. Но в ряде случаев практически важно по минималь- 
ному количеству наблюдений выявить, существенно ли общее и 


парциальное влияние двух факторов без учета их взаимодействия. 
Поэтому сначала рассмотрим схему двухфакторного JIA, когда 
повторные наблюдения отсутствуют, затем изложим схему с по- 
вторными наблюдениями. 

При отсутствии повторных испытаний и произвольном коли- 
честве уровней каждого из двух факторов имеем схему испыта- 
НИЙ { x g, где { — количество уровней фактора A ид— количество 
уровней фактора В. Соответственно имеются уровни А; (1 = 
1,2,3,...,1) и уровни В; (# = 1,2,3,...,9)— всего tg испытаний. 
Причем, как показано в табл. 6.9, для каждой пары A;B; имеет- 
ся всего одно наблюдение 2); переменной Х. 

Если влияние факторов существенно, то оно должно сказывать- 
ся на вариативности между столбцами, обусловленной фактором 
А, и на вариативности между строками, обусловленной фактором 
В. Поэтому для расчета факторных дисперсий необходимо опре- 
делить суммы квадратов отклонений по столбцам и по строкам, 
кроме того, нужны соответствующие суммы для общей и остаточ- 
ной дисперсий. Эти четыре суммы квадратов отклонений вычи- 
сляются по следующим формулам: 


И (6.13) 


2 


thea Tite НТ 
“FL FIG + |, 


i=l j=l 


где @ — общая сумма квадратов отклонений; Qa и в — суммы 
квадратов отклонений по факторам А и В; @, — остаточная сумма. 
Легко видеть, что выполняется равенство 


9 =9^+9в+9.- 


Вычисление отдельных слагаемых, образующих суммы, не пред- 
ставляет затруднений. Отметим лишь, что Ha основе равенства 
суммы по столбцам и суммы по строкам (см. табл. 6.9) член 


2 
rg (Sia 5;) может быть заменен равным ему членом 2001: 50. 


Таблица 6.9 


Первичные данные для двухфакторного ДА без повторных 


наблюдений 
Суммы по Квадраты 
das | "Аз |5] Ae строкам сумм по 
рама 
ти Ss (si? 
pn Е. (sh)? 
Ра я (5 
re Е (50 
a= Dhar Ss = | DLS? 
5; |...| | =D," 
5 $] Djar(S)* 


столбцам 


По Фишеру, в рассматриваемом случае учитываются следую- 
щие степени свободы. Для факторных дисперсий — по числу уров- 
ней фактора минус одна: {-Тид-1. Для остаточной диспе- 
рсии — общее количество степеней свободы минус суммарное чи- 
сло уровней без единицы: 14 -(9+{- 1) = (#-1)(9-1). Для об- 
щей — суммарное число степеней свободы без одной: 15 —1. Легко 
видеть, что 


18-1= (1-1)(9-10+(-0+(-1. 


По методу Фишера оцениваемые компоненты дисперсии вычи- 
сляютсл следующим образом: 


2A = sDalx]+ вах, 

=. = tDp[X] + ВЫХ], (6.14) 
а. 

06-0 PT 


На основе правых частей равенств (6.14) и соответствующего ко- 
личества степеней свободы вычисляются и проверяются диспе- 


Отредактировал и опубликовал на сайте : 


рсионные отношения: 


pea) = DalX] + D[X] 
P3t—1/(t~1)(g—1) = т , (615 
pe) = 28] + рых] 9 
Ря-и 4-06-07 DX] . 


Пользуясь исправленным методом, будем вычислять дисперсии по 
уравнениям, аналогичным (6.10), а затем проверять Ё(® по (6.15). 

Пример 6.3. В рассмотренном выше примере 6.1, оценивая вли- 
яние наглядности в преподавании тремя методами, мы не прини- 
мали во внимание такие существенные для успешного овладения 
материалом переменные, как прошлые успехи школьника в изуче- 
нии предмета, его интерес к предмету и к учебе вообще и многое 
другое. При однофакторном ДА эффект этих переменных сумми- 
ровался с эффектом метода преподавания и не мог быть выявлен. 
Но интересно определить парциальные эффекты метода препода- 
вания и, например, прошлой успеваемости школьников по данному 
предмету. Чтобы это было возможным, необходимо упорядочить 
учеников (для каждого из трех методов преподавания), согласно 
их предыдущей успеваемости. Пусть, например, первая тройка 
учеников (по одному на каждый из проверяемых методов препода- 
вания) включает в себя наиболее успевавших в прошлом, вторая 
тройка — успевавших чуть менее, третья — еще менее успевавших 
ит.д, наконец, последняя, пятнадцатая тройка — это наименее 
успевавшие ученики. 

Полученные таким путем тройки учеников представляют со- 
бой уровни нового для нашего примера фактора — фактора пре- 
дыдущей успеваемости школьников. Таким образом, у нас те- 
перь рассматриваются два фактора. Первый фактор назовем 
его А — это наглядность в преподавании; он имеет три уровня А; 
(j = 1,2,t; t = 3). Второй фактор — обозначим его В— это пре- 
дыдущая успеваемость школьников; пусть он имеет по-прежнему 
пятнадцать уровней В;(# = 1,2,...,9; 9 = 15). 

Если в примере, рассматривавшемся выше, группы учеников 
для преподавания каждым из трех методов выбирались случай- 
но, то теперь, на основании только что изложенной схемы, нужно 
учесть предыдущую успеваемость учеников. Это означает, что из 
числа пятнадцати различных по успеваемости групп* необходимо 
случайным образом выбрать из каждой группы трех учеников co- 
ответственно трем методам преподавания. Далее с выборкой в 45 
учеников проводится эксперимент, как указано в примере 5.13. 


*Успе: 


емость внутри группы должна быть примерно одинаковой. 


Отредактировал и опубликовал на сайте ::: 


Таблица 6.10 
Исходные и промежуточные данные для двухфакторного ДА. 
при отсутствии повторных наблюдений 


Уровни A, il 
| | (51) 
AL _|* Аз 
1s | is | 16 a 1536 
в | 13 | 17 45 2025 
1 | 14 | 15 41 1681 
м | в | 16 45 2025 
2 | um в 41 1681 
13 | 13 | 17 43 1849 
и 14 9 за 1156 
Уровни В, is} aa | в 38 1444 
и 2 | 15 38 1444 
2] | 13 39 1521 
9 | 0 | 13 32 1024 
u | ma] 39 1521 
10 9 9 28 784 
7 9 | 14 30 200 
10 6 8 24 576 
т 173 | 184 | 204 | М=551 |218. (si? = 
21567 
Е 29929 | 33556 [ 41616 | 72.,(5,)? = 105401 
me 2035 | 2354 | 2890 | O3_, Dis; 27, = 7297 


Результаты эксперимента табулируют согласно табл. 6.9. Вы- 
числяют сначала промежуточные значения для слагаемых сумм 
квадратов отклонений (уравнения (6.13)) —они представлены в 
нижней части табл. 6.10, а затем находят сами слагаемые и суммы 


Qe 


= j=l 


Суммы квадратов отклонений представлены в табл. 6.11. Tam 
же показаны результаты ДА. Можно видеть, что влияние обоих 
проверяемых факторов значимо, так как эмпирические дисперси- 
онные отношения превосходят критические значения F* при дове- 
рительной вероятности Р = 0,99. 


Таблица 6.11 


Результаты двухфакторного ДА при отсутствии повторных наблюдений 
к примеру 6.3 


Вариатив- Суммы Число 'Оцени- | Число `Дисперсионные 
ность квадратов степеней ваемая | степе— отношения 
откл: й | свободы для | дисперсия | ней сво— 
вычисления боды 
дисперсий для F* 
По фаю | Чл = 1026,7 44 DalX]= 2 Fast тает = 
тору А 6993, 8 = 32, = 0,748 =7,52 
По фак- | Qp = 7189, 0— 44 Dp{X] = 14 FR) = Pub Pal) = 
topy B | 6993,8 = 195,2 = 4,436 28,74 
Qo = 7297, 0- 
Octatou- 7189, 0~ 44 Do[X] = 28 FA) > Вл ‚уз 5,45 
ная 7026, 0+ =1,72 
6993, 8 = 75,8 
Общая 9 = 7297,0- 44 DIX] = - PPS Fo ee sappe 208i 
6993,8 = 303, 2 = 6,89 т.е. влияние A 


и В значимо 


{.}.1. Схема расчета при наличии повторных испытаний 
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При наличии повторных испытаний и произвольном количе- 
стве уровней каждого из двух факторов имеется схема испыта- 
ний t х дх п, где по-прежнему { — количество уровней одного из 
факторов (например, A), 9— количество уровней другого факто- 
ра (В); п количество повторных наблюдений изучаемой пере- 
менной, одинаковое для сочетаний по два всех уровней факторов. 
Первичные данные в этом случае группируются в «блоки» по п 
значений хер, соответствующих каждой паре А; В; уровней факто- 
ров А и В, как это показано в табл. 6.12. 


Таблица 6.12 
Первичные данные для двухфакторного ДА. 
повторными наблюдениями 


Е Уровни фактора А 
мм 
1 | газ | а Ean) rin 
2 | 2122 | 2322 ти 
В | & | ть | 212% тив 
® | zn | зи тат 
1 | 211 | 2221 720 
2 | 2212 | 2222 130 
в: танк 
Уровни Fatn 

фактора В zit 
в, 
Fg 290 
аз 2902 
B, ть 
Syyn тии 
*k=1,2,...,n—momepa повторных наблюдений. 


Значения 2+; изучаемой переменной Х ‚ сгруппированныев бло- 
ки, наблюдаются при одних и тех же (внутри каждого блока) уров- 
нях обоих факторов. Поэтому их дисперсия наряду со случайны- 
ми флюктуациями обусловлена совместным действием факторов 
при каждой паре уровней. Чтобы выявить компонент дисперсии 
DaplX], обусловленный совместным действием факторов, необхо- 
димо к четырем суммам Q; квадратов центральных отклонений до- 
бавить пятую сумму — Олв, определяемую для блоков. При этом 


из-за введения дополнительной переменной все формулы (6.13) не- 
сколько усложнятся: 


%=15 (Ed) -4 (EE ; wt) 


где Qa и Ов— суммы квадратов отклонений по факторам А и 
В; Олв — сумма квадратов отклонений для совместного действия 
факторов; Qo — для остаточной и @ — для общей дисперсий. Мож- 
но видеть, что выполняется равенство 

@ = @л + Qp + дв + Qo. 

Согласно Фишеру, число степеней свободы для Da{X] и Ов(Х] 
остается прежним: {—1 и 9—1 соответственно. Для остальных ком- 
понентов дисперсии оно определяется следующим образом: для 
Das[X]: (t — 1)(9 - 1); для Do[X]: (п — 1)tg; для D[X]: tgn — 1. 

По исправленной методике для всех дисперсий принимается од- 
HO и то же число степеней свободы: tgn —1. Дисперсионные от- 
ношения для проверки значимости парциального и совместного 
действия факторов определяются по формулам 


pa = 29DalX] +тРлв(Х] + О. [Х] 


р] : 
p8 _ #Ов[Х] + nDan[X] + Do[X] 
wf Do[X] : 
pas — MDaplX] + рых] 


Do[X] 


Пример 6.4*. Экспериментально исследовалось влияние лвух 
факторов на успешность прохождения крысами лабиринта. Один 
из факторов — степень подвижности (активности) крысы, другой — 
‘условия содержания, в различной мере способствующие формиро- 
ванию активности животного. Было три уровня первого фактора, 
по которым все крысы подразделялись на три группы: подвижных 
(bright), уравновешенных (mixed) и вялых (dull), и два уровня вто- 
рого фактора, по которым каждая из трех групп делилась на две 
подгруппы: содержащихся в свободных (free) условиях и содержа- 
щихся в стесненных (restricted) условиях. В каждую из подгрупп 
(блоков) входило восемь крыс. В табл. 6.13 представлены резуль- 
таты эксперимента**. 


Таблица 6.15 
Исходные данные к примеру 6.4 


Степень активности крысы (A,) 
k 
А:- А- 
подвижные | уравновешенные 
— 
1 26 a 
2 4 26 
Bi— 3 28 19 
свобод- |4 92 59 7 
ные |5 14 82 87 
6 16 86 99 
7 29 45 126 
Условия 8 31 37 104 
содержа- 
ния (В+) 1 51 39 42 
2 96 104 92 
Вг— 3 97 130 156 
стеснен- | 4 22 122 144 
ные 5 35 114 133 
6 36 92 124 
7 28 87 68 
8 76 64 142 


Для вычисления сумм квадратов центральных отклонений по 
формулам (6.16) требуется выполнить промежуточные расчеты, 


Заимствован из кн.: Ferguson С.А. Statistical Analysis in Psychology and 
Education. New York, 1966. P.317. 
**Дж, Фергюсон ие указывает, KAKAK переменная измерялась, но, судя по 
данным табл. 6.13, можно думать, что это какая-то количественная характе- 
Ристика успешности прохождения лабиринта. 


Отредактировал и опубликовал на сайте 


результаты которых удобно табулировать, как это сделано в 
табл. 6.14. Лалее каждая из 12 сумм из табл. 6.14 возводится в 
квадрат, a затем осуществляется суммирование: 


2 


3 8 3 
У: (Sa) = 2137469, 
i=l \eat 


= 4015617, 


= 5944 837, 


SS ei = 11175649 


Кроме того, непосредственно по табл. 6.13 получают 


зав 
LYE Y a, = 309851. 
js =| 


Теперь остается лишь подставить значения сумм в формулы (6.16) 
и при t = 3, 9=2, т = 8 вычислить Q;. Все остальные расчеты 
тривиальны. Поэтому в табл. 6.15 приводятся лишь окончатель- 
ные результаты дисперсионного анализа, выполненного по испра- 
вленной методике. 

Как показывает сравнение эмпирических значений дисперси- 
онных отношений с их теоретическими значениями, парциальное 
действие обоих изучавшихся факторов существенно, но их взаимо- 
действие не существенно. Следовательно, в качестве более полной 
оценки случайных флюктуаций можно принять сумму 


Di[X] = БАв(Х] + Б.[Х] = 936, 16. 


Отметим в заключение, что двухфакторный анализ с повторны- 
ми наблюдениями возможен и при неодинаковом количестве дан- 
ных в блоках*. 


*Cxema расчетов для этого случая приведена в кн.: Ferguson С.А. Statistical 
Analysis in Psyhology and Education. New York, 1966. 


Таблица 6.14 


Промежуточные величины для расчета сумы квадратов 
по формулам (6.16) к примеру 6.4 


| Суммы по строкам 


= oa Е 

в: (cha 2%), = (Shea 24), = (Ete Fat), г (Sha 21 2%), = 
=277 = 395 = = 1249 

=), = (53-Х), = 


= 901 = 2094 


(Ctasm),,= | Chesw),= | (oe 


= 441 = 752 


Суммы по | (2: Dhar ut), = | (Dre Dhar ue), = | (Leer Dhar sn), = | (Deer Зы Dhar ak) = 
= 1147 = 1478 = 3343 


столбцам =718 


Отредактировал и опубликовал Ha сайте 


6.4. ТРЕХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 


Схема трехфакторного дисперсионного анализа похожа на схе- 
му двухфакторного ДА с одинаковым количеством повторных на- 
блюдений, только вместо них берется п уровней третьего фактора, 
Cy, где k = 1,2, п. 

Если при трех факторах отсутствуют повторные наблюдения, 
то нельзя определить взаимодействие АВС. Поэтому начнем рас- 
смотрение сразу со схемы трехфакторного эксперимента, в ко- 
тором при каждой комбинации факторов имеются повторные на- 
блюдения. Итак, имеем три фактора: А; (j = 1,2,...,й), В; 
(#=1,2,...,9) и Сь (К = 1,2,...,n). Кроме того, для каждой комби- 
нации уровней А;В;Сь имеется | повторных наблюдений значений 
Zijkm переменной Х (т = 1,2,...,1) — всего #9п] наблюдений. 


Таблица 6.16 
Первичные суммы для вычисления сумм кнадратов 
центральных отклонений 


AY Аз 
с С с | С 
В, [ DAiBiC: | У А, ВС; | D APB: | САзВ:С» ов: 
Bz | 5 А1ВаС; | ХА! B2C2 | У АзВаС: | LA2B2C2 в: 
LAG 

Общая сумма 

всех 
AiBy наблюдений 

В: С: Deem 


Примечание. DA, = ХА, С: + ХА, С2; С» = DAC + 
ЗАзСь; DAB: = ЗА, В.С! + А, В,Са; 5 ВьСь = Аа ВСь + 
DAB, Эти формулы легко обобщаются на большее, чем 2, 
число уровней факторов. 


Пусть наблюдения сгруппированы поблочно (в блоке | повтор- 
ных наблюдений) в черновых таблицах. Суммируя значения Zij km 
в каждом из блоков, определим суммы > Dey А, В;Сь, которые за- 
пишем в табл. 6.16*. Затем вычислим остальные суммы для ком- 
бинаций факторов по два и для парциального действия факторов. 
Эти суммы для простоты обозначены и рассчитываются так, как 
показано в табл. 6.16. 


*Индекс т в таблице опущен. 


Таблица 6.15 


Результаты двухфакторного ДА с повторными: 


наблюдениями к примеру 6.4 


'Варизтивность | Суммы квадратов | Число | Оценивьемая `Лисперсионные отношения. 
отклонений | степеней | дисперсия 
свободы 
По фактору А Qa = 14875,52 ат Da[X] = 316,50 | FIA) = = 358 .2-316,5+8-28, 34+ 
4907,82) = 6,83 
По фактору В Qp = 18150, 04 47 Dp[X] = 386,17 FAP) = 1 (8-3 -986,17 4 828,944 
+307, 82) = 11,46 
. if 
Для вэвимодействия | Qaw=1992,08 | 47 | Dan[X]=28,98) AR) = SAREE SOE? 95 
див ь 
Остаточная Qo = 42661,38 a7 Do[X] = 907,82 FA) > Ели = 5,15 
Общая 9 = 77024,98 a7 D[X] = 1638, 83 FO) > Fo syrjen = 7,27 
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Суммы квадратов центральных отклонений вычисляются по 
следующим формулам: 


А pew 
= (23) - ae 
9-22 (D%) yD 
Qan = pes (Sasi) - Qa -Qp- pat cout 
лс = HED (LAB) - 9,9 нь 
Qe = FEE (2в)' - 9-е. | 6 
Флвс = FELL (олве,) -9^-9-95- 


lw 
— Qas - Qac - Овс — то 


Q = OO У leisem)? - Oa - Qa - Qc - Члв- 
Ef т 


2 


— Час - вс — Члвс — aa аа 
1 2 
9= LLL Lieven)? вт Бы 


Нетрудно видеть, что основное уравнение дисперсионного анали- 
за в системе уравнений (6.17) выполняется: 


9 = 9л + 9в+9с + Оль + Олс + Овс + Члвс+9.. — (6.18) 


Определяя соответствующие ‘дисперсии, следует разделить ра- 
венство (6.18) почленно на общее число степеней свободы (tgnl—1). 
Источники вариативности, количество степеней свободы и диспе- 
рсионные отношения в общем виде записаны в табл. 6.17. Проце- 
дуры расчета и проверки значимости компонент общей дисперсии 
аналогичны рассмотренным выше. 

Прежде чем перейти к примеру, сделаем два дополнительных 
замечания. 


Таблуча 6.17 


Табулированные результаты трехфакторного дисперсионного анализа 
с повторными наблюдениями 


Источники Количество 
вариативности | степеней свободы Лисперсионные отношения 
= их 
х(атОл + яОль + 9Dac + Шлвс + Со 
в э-1 FO) = 1. 
x(tnDp + пОлв + tDpc + авс + 2) 
с п-1 FO) = ox 
bare + sdac + Фвс + авс + Do) 
AB (t= 19 ~1) = gi ("лв + авс +Do) 
АС (t=1)(n-1) а Ос + авс +Do) 
BC (g-1)(n=1) ЕВС) = р. (вс + авс + Do) 
АВС (¢-1)(g-1)(n-1) АВС" (Юве + Бо) 
Случайные tgn(t—1) 
Итого 1 


Примечание, Обозначения дисперсий сокращены: Da — вместо 
DalX], Рав — вместо Dag[X] и т.п. 


1. Изложенная схема трехфакторного анализа с повторными на- 
блюдениями без труда упрощается до схемы без повторных на- 
блюдений: в табл. 6.16 все SA; B/C, заменяются одним числом; в 
формулах (6.17) | = 1 можно опустить, а Олвс выпадает, так как 
ее нельзя выделить из Qo; из табл. 6.17 выпадают значения (Юлвс 
и Р(АВС). 

2. Лля упрощения расчетов дисперсионного комплекса полезно 
применять линейные преобразования исходной переменной 


тат = аут + 6, 
т.е. перейти к новой переменной 


Zijkm — 6 
а 
с переносом начала отсчета b и изменением масштаба. Следует 
вспомнить, что при этом значения (); оказываются измененными в 
а? раз (уменьшенными, если а > 1, и увеличенными, если а < 1), 
и это необходимо учитывать при окончательном расчете диспер- 
cuit Dj. 


Vijem = 
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Пример 6.5*. Рассмотрим трехфакторную схему с повторными 
наблюдениями переменной Х,, значения которой 2+» представле- 
ны в табл. 6.18. 


Таблача 6.18 
Значения переменной Х для трехфакторного ДА. 
к примеру 6.5 


Числа в табл. 6.18 большие и содержат дробную часть. По- 
этому осуществим линейное преобразование переменной, выбрав 
в качестве свободного члена ближайшее к математическому ожи- 
данию целое число b = 28, а в качестве нормирующего множителя 
а= 0,5, чтобы избавиться от дробей: 

Yijkm = 2(Zijem — 28). 
Значения преобразованной переменной У приведены в табл. 6.19. 
Вычислим по этим данным все суммы, согласно табл. 6.16; резуль- 
таты представлены в табл. 6.20. Пользуясь данными табл. 6.20, по 
формулам (6.17) вычислим суммы квадратов центральных откло- 
нений: 


1 


= ea в = 

Qa = уч" + (-16)"] 3g 15)* = 11,28, 
aa 2 + (38) - 2 (-13)? = 

Qe = 45 + (-38)?] - 55(-13)? = 124,03, 
РАК —32)2 2] 11—13)? = 

Qe = 4-32) + 197] 55(-13} = 81,28, 


Олв = pyr + (-14)? + 8? + (-24)?] - 11, 28- 
1 == 
~124,03 — 35(~13)? = 0,03, 


“Заимствован из кн. Хикс Ч. Основные принципы планирования oxc- 
перимента. M., 1967. 


бла= palo? + 13? + (—22)? + 67] — 11, 28- 
1 2 
—81,28— 38-13) = 0,78, 
Ope = ИЗ +28 + (20) + (-9)] - 124,08- 
1 и 
—81,28 — 35(-13) = 3, 78, 

@лвс = G12" + 15+ (54) +19? + (12)? + (9+1 
+(~7)?] — 11, 28 — 124, 03 — 81, 28 — 0,03 — 0, 78— 
-3,78 — свя = 0,79, 

Qo = 441 — 11,28 - 124,03 - 81, 28 — 0,03 — 0, 78- 

1 3 
—3,78—0,79— 32(713) = 213,75, 


= к № 2 — 
9=441 — 55(-18)? = 435,72. 


Таблица 6.19 
Значения новой переменной у = 2(z - 28) к примеру 6.5 


Рассчитаем дисперсионные отношения по методу Фишера и по 
‘исправленному методу. Заметим, что для вычисления можно поль- 
зоваться суммами квадратов и дисперсиями случайной перемен- 
ной У. Результаты трехфакторного дисперсионного анализа дан- 
ных рассматриваемого примера по методу Фишера представлены 
в табл. 6.21. Можно видеть, что из семи нулевых гипотез, которые 
состоят в допущении неслучайного влияния факторов А, ВиСв 
отдельности, по два и по три, приняты могут быть только две, а 
именно — относящиеся к факторам В и С. 
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Таблица 6.20 
Первичные суммы для вычисления ©; к примеру 6.5 


A Аз 
с: Ca Cy | с» 
1. 2 15 5 13 25 
By -12 -2 “1? а —38 


ХА: С: = -10] ХА; С; =13 | AVC; =-22] DAC =6 
ХА, =3 ЗА: =-12 
DO =-32 LG =19 
DAB: = 17 |S AiB2 =-14] ХАЗВ, =8 [DO АзВ2 = -24 
DBC; = -3 | DB C2 = 28 | В2С; = -29] D B2C2 = -9 


Таблица 6.21 
Результаты трехфакторного ДА по методу Фишера к примеру 6.5 


Кол-во Средний 
Источник | степеней | ©, квадрат | Эмпирическое 
вариативности | свободы. отклонений FO) 
A 11,28 1,26 
B 124,03 13,92 
с 81,28 9,12 
АВ 0,03 0,00 
AC 0,78 0,09 
BC 3,78 0,42 
ABC 0,79 0,09 
Случайные 8, 91 - 


Примечание. Подчеркнуты значимые на 99%-м доверитель- 
ном уровие дисперсионные отношения. Напомним, что мпири- 
ческое F\") получается как частное от деления i-ro средиего к! 
драть отклонений на 8,91, соответствующее остаточной диспе- 
рсии. 


Tak как вариативность, обусловленная источниками A, AB, BC, 
АСилВС, должна рассматриваться как случайная, то логично от- 
нести эти источники вариативности в группу случайных прочих 
факторов. Для схемы Фишера это означает, что соответствую- 
щие суммы квадратов центральных отклонений (); должны быть 
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Табльче 6.22 
Результаты трехфакторного ДА по исправленному методу 
к примеру 6.5 


Кол-во 

Источник | степеней | ©; | Di = % | Эмпирическое 

зариативности | свободы Е 

А nu 11,28 0,364 1,23 

B 31 [124,03 | 4,001 3,37 

с 31 81,28 | 2,609 2,57 

AB 31 0,03 | 0,001 1,02 

AC 31 0,78 | 0,026 1,02 

BC a 3,78 0,122 1,05 

ABC 31 0,79 | 0,026 1,02 

Случайные 31 | 213,75 | 6,900 - 
Итого: 31 [435,72 | 14,005 


Примечания, 1. О! — то дисперсии случайной переменной 
У; для исходной случайной величины Х дисперсии Dj = а? 
0,250;. 2. Эмпирические дисперсионные отношения вычисля- 
лись по формулам, приведенным в табл. 6.17. 


включены в ©’: 


Q = Qa + @лв + Qac + Овс + @лвс + Qo = 
= 11,28+0,03+ 0,78 + 3,78 + 0,79 + 213,75 = 230, 41. 


Новой сумме ©, аккумулирующей в себе влияние случайных 
факторов, соответствует теперь и новое число степеней свободы: 
5+24 = 29. Поэтому и средний квадрат отклонений, выражающий 
по Фишеру оценку остаточной дисперсии, становится несколько 
меньше, чем прежде: 230,41 : 29 = 7,94. В нашем примере это 
приводит к увеличению эмпирических дисперсионных отношений, 
и без того значимых, но в других случаях можно незначимое FU) 
«перевести» в значимое или наоборот, т.е. изменить решение на 
противоположное. 

Результаты трехфакторного дисперсионного анализа, выпол- 
ненного с разложением дисперсий по Авилову, представлены в 
табл. 6.22, Можем видеть, что все эмпирические дисперсионные 
отношения оказываются по величине меньше, чем Е-критическое. 
Следовательно, для каждого из факторов и факторных взаимодей- 
ствий исходная гипотеза о неслучайном влиянии факторов А, Ви 
С на переменную Х должна быть отброшена и (при данном числе 
наблюдений) должна быть принята альтернативная гипотеза: пар- 
циальное влияние факторов и их взаимодействий не отличается OT 
случайного. 

Остается проверить, отличается ли от случайного совокуп- 
ное действие всех рассмотренных факторов и их взаимодействий? 


При такой постановке вопроса многофакторная схема сводится к 
однофакторной: 
D[X] = 0%[Х] + Р.Х], 

где D[X]—o6mas дисперсия, которая рассматривается как сум- 
ма только двух компонент: Dg[X]— факторной дисперсии, обусло- 
вленной действием всех изучаемых факторов, и О.[Х] — остаточ- 
ной дисперсии, обусловленной неконтролируемыми в опыте при- 
чинами. 

Очевидно, что факторная дисперсия— это сумма «парциаль- 
ных» дисперсий факторов и их взаимодействий. В частности, для 
трехфакторного анализа, 


Dj = Dy + Dg + De + Ав + Dac + Dgc + БАвс- (6.19) 


Число степеней свободы для Dy определяется суммой степеней 
свободы слагаемых в правой части уравнения (6.19); оно соста- 
вляет #911 — | (см. табл. 6.17). 
Эмпирическое дисперсионное отношение здесь вычисляется как 
пои однофакторном анализе: 
(tgnt 


1)0, + 0% 
5, у 
Используя значения дисперсий П! из табл. 6.22, вычислим фак- 
торную дисперсию и Fy: 
Dj = 0,364 + 4,001 +2,609 + 0,001 + 0,026 + 0, 122+ 
+ 0,026 = 7, 149. 


Проверка показывает, что с точностью до тысячных долей основ- 
ное дисперсионное уравнение (6.1) выполняется: 


_ 7-1,149+ 6,9 
я 6,9 
что больше критического FF зол) = 3,52. Следовательно, мож- 


но принять, что совокупное действие рассмотренных факторов на 
переменную Х отличается от случайного. 


F, 8,25, 


§.§, ОСНОВЫ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА 
} 1 |. Понятие о математическом планировании эксперимента 


Математическое планирование эксперимента — это направле- 
ние научных исследований, которое связано с созданием теории 


эксперимента и которое представляет собой определенный син- 
тез дисперсионного и регрессионного анализа, основанный на не- 
скольких принципиальных для этого направления положениях. Их 
мы и рассмотрим. 

Рандомизация условий эксперимента. Условия эксперимента 
образованы совокупностью контролируемых и неконтролируемых 
факторов. Рандомизация означает сочетание этих факторов в хо- 
‘де эксперимента в случайном порядке, для того чтобы нивели- 
ровать за счет усреднения возможные эффекты воздействия не- 
контролируемых факторов, большинство которых ‘исследователю 
неизвестно, на результаты эксперимента, выделяя таким образом 
достаточно надежно изучаемые эффекты контролируемых факто- 
ров. Принцип рандомизации был создан еще Р.Фишером в клас- 
сическом дисперсионном анализе. Но именно в математическом 
планировании эксперимента рандомизации придается основопола- 
гающее значение. 

Планированче на двуг уровнят. Контролируемые факторы, пред- 
ставляющие собой аргументы изучаемой зависимости, варьиру- 
ются в эксперименте только на двух уровнях: 1) отсутствие 
или наличие, если аргументом служит качественный фактор — 
какое-нибудь неквантифицируемое свойство (например, мужской 
‘или женский пол испытуемых); 2) минимальное или максималь 
ное значение, если аргументом служит количественный фактор— 
какая-нибудь и как-нибудь квантифицируемая неслучайная пере- 
менная величина. Неопределенность в понятии «минимальное — 
максимальное значение» приводит к тому, что зачастую необходи- 
мо расширять зону поиска таких значений контролируемых фак- 
торов, при которых зависимость, обусловленная их влиянием, вы- 
делялась бы из «шума», создаваемого неконтролируемыми факто- 
рами. Поэтому когда заранее невозможно выбрать наименьшее и 
наибольшее значения исследуемых факторов, то сначала, по апри- 
орным соображениям, выбирают для каждого из них некоторое 
среднее значение — так называемый центр планирования факто- 
ра, а затем, повторяя эксперимент, путем ряда последовательных 
итераций расширяют зону ‚рования «минимаксных» значений 
аргументов и эмпирическим путем обнаруживают Te, при которых 
влияние на зависимую случайную величину «выделяется из шу- 
ма» (это проверяется по Р-критерию Снедекора — Фишера, как в 
дисперсионном и регрессионном анализе). 

Активность эксперимента. В классическом эксперименте — 
особенно если это естественный эксперимент — значения сочета- 
ний контролируемых факторов выбирает природа, a эксперимен- 
татор пассивен, так как вынужден полагаться на волю случая. B 
отличие OT этого при математическом планировании эксперимен- 
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та исследователь активен: он сам выбирает и варьирует контроли- 
руемые факторы, подбирая их уровни и сочетая эти уровни друг с 
другом, а неконтролируемые факторы нивелирует путем рандоми- 
зации условий эксперимента. Сразу же заметим, что в психологии 
идея активности эксперимента не всегда может быть реализована, 
и это ограничивает применимость математического планирования 
эксперимента. 

Априорный выбор зависимости. В дисперсионном анализе во- 
прос о том, каким образом изучаемая величина зависит от кон- 
тролируемых факторов, т.е. о виде уравнения, которое мате- 
матически выражает зависимость, не ставится. Ограничивают- 
ся вопросом, влияет или нет контролируемый фактор, сочетание 
факторов на изучаемую величину. При этом оценивается отно- 
сительная степень влияния с помощью уравнения, которое связы- 
вает сумму коэффициентов детерминации (3.14a, 6) и которое для 
М№-факторного дисперсионного уравнения (6.4), если его почленно 
нормировать безусловной дисперсией D[X] зависимой переменной 
X, преобразуется к виду 


1=%+77(4) = 
= 78 +74, +72, tot ay + has ++ ПА, А.А» 


где А = {A;, Аз,..., А. Аз,..., А. Аз...Ам}. В регрессионном ана- 
лизе в дополнение к дисперсионному ставится и решается вопрос о 
форме зависимости, которая аппроксимируется подходящим урав- 
нением регрессии. В отличие от этого при математическом пла- 
нировании эксперимента сразу же ставится цель — выразить иско- 
мую зависимость аналитически, но уравнение для этого не подби- 
рается к эмпирическим данным, а выбирается заранее, исходя из 
количества контролируемых факторов и теоретически возможных 
сочетаний этих факторов по два, по три и т. д. — по М. 

Полнота плана эксперимента. Полным называется план, в кото- 
ром учтены все теоретически возможные сочетания уровней фак- 
торов по отдельности, по два, по три и т. д. — по №. При планиро- 
вании на двух уровнях число различных сочетаний составит 


ф= АКА, (6.20) 


где К — количество сочетаний из М по два, по три ит. д., которое 
определяется суммой: 


K =Ch+ Cy +--+ CN +8. 


Единица в показателе степени формулы (6.20) связана с необходи- 
мостью оценки остаточной дисперсии в уравнении (6.4), на основе 


которой оценивается значимость коэффициентов регрессии, полу- 
ченной по математическому плану эксперимента. Нетрудно по- 
нять по (6.20), что с увеличением количества факторов, контроли- 
руемых в эксперименте, число L, которое определяет количество 
необходимых испытаний, т.е. объем выборки, быстро становится 
превышающим реальные возможности исследователей. Поэтому 
стремятся уменьшить количество контролируемых фэкторов до 
существенного минимума, убраль из рассмотрения практически 
нереальные сочетания уровней факторов и самих факторов либо 
отказываются от полного плана и заменяют его дробным планом. 
В дробном плане эксперимента используются не все сочетания, 
а лишь некоторые — так называемые дробные реплики. Хотя и су- 
шествуют способы подбора дробных реплик, наименьшим образом 
ухудшающих планирование, дробные планы лишают исследовате- 
ля преимуществ, даваемых математическим планированием экспе” 
римента. 

Ортозональмость плана. Она заключается в том, что влияния 
аргументов на изучаемую величину при полном плане линейно ме- 
зависимы (ковариационная матрица плана равна нулю). Это при- 
водит к описанию изучаемой зависимости чистой регрессией (см. 
раздел 4.2.3), коэффициенты которой определены независимо друг 
от друга, что позволяет отбрасывать члены уравнения с незна- 
чимыми коэффициентами, не пересчитывая остальных. В клас- 
сическом регрессионном анализе такая возможность отсутствует. 
Отсутствует она и при дробных планах эксперимента. 

Единообразие и простота вычислений. Как будет показано, рас- 
четы по плану эксперимента до предела упрощены. Они сводятся 
к суммированию наблюдавшихся значений зависимой переменной 
со знаками «плюс» или «минус», соответствующими вертнему или 
нижнему уровням фактора в столбце плана, по которому проведен 
эксперимент, и делению суммы на число слагаемых. Вычисления 
средних дисперсий тоже упрощены. Процедура расчетов в целом 
простая и четкая. 

Равноточность измерений. Коэффициенты регрессии при мате- 
матическом планировании эксперимента вычисляются из одного 
и того же числа измерений, которое определяется количеством 
строк Ё в плане, одинаковым для всех столбцов. Следовательно, 
все коэффициенты регрессии вычисляются с одной и той же стан- 
дартной погрешностью 


ва; = VDoi(L—1), (6.21) 


где О. — остаточная дисперсия, определяемая из повторных изме- 
рений, — при повторении эксперимента по плану хотя бы дважды; 
Т— общее число измерений (формула (6.20)). Поэтому проверка 


значимости всех коэффициентов регрессии предельно проста: ко- 
эффициенты сравниваются со стандартной погрешностью, умно- 
женной на соответствующий квантиль {-распределения Стьюден- 
та ({-критерий), и Te из них, которые меньше, отбрасываются как 
незначимые вместе с относящимися к ним членами уравнения ре- 
грессии. 

Все рассмотренные основополагающие идеи математического 
планирования, за исключением активности эксперимента, не со- 
здают особых препятствий в экспериментальной психологии но 
могут способствоваль более быстрому и качественному выявле- 
нию тех психологических законов, которые во многих случаях по- 
ка остаются на уровне утверждений, а чаще предположений о вли- 
янии или не влиянии чего-либо на индивидуальную психику и кол- 
лективные психологические феномены. 


1.1.1. Построение полного ортогонального плана эксперимента 
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Процедура математического планирования эксперимента начи- 
нается с выбора общего вида уравнения множественной регрес- 
сии, которым предположительно аппроксимируется искомая зави- 
симость. Под эту зависимость и строится полный ортогональный 
план или несколько эквивалентных вариантов такого плана, по- 
сле чего проводится эксперимент и обрабатываются данные. В 
результате уравнение записывается в явном виде, со значимы- 
ми коэффициентами, величина и знаки которых характеризуют 
силу и направленность влияния контролировавшихся факторов- 
аргументов модели. В этой процедуре выбор исходного уравнения 
не формализован: он обусловлен конкретным содержанием науч- 
ной задачи, наличием априорной информации и ресурсами иссле- 
дователей. Вычислительная сторона обработки данных, как было 
сказано, простая и четкая, формализованная. А вот центральный 
этап процедуры — построение плана эксперимента, удовлетворя- 
ющего требованиям полноты и ортогональности, хотя такое по- 
строение может быть формализовано и запрограммировано для 
ЭВМ, — содержит ряд приемов, с которыми нужно познакомиться 
психологам. 

Начнем с простейшего, элементарного случая — с простой ли- 
нейной регрессии, уравнение которой в общем виде запишем так: 


У= 40 + а121. (6.22) 


Напомним, что свободный член ao выражает значение у при #1 = 0, 
а коэффициент a; при аргументе 21 выражает приращение зависи- 
мой переменной в отношении к приращению аргумента: a; = Ду: 


Az, тем самым характеризуя меру влияния (обусловливания) ве- 
личины у со стороны аргумента 21, если, конечно, коэффициент 
статистически значим по условиям эксперимента. 

В математическом планировании, как было указано, аргумен- 
ты планируются на двух уровнях — нижнем и верхнем, причем из 
натурального масштаба измерений они преобразуются в безраз- 
мерную форму — «плановый» масштаб: 


(2min — 2max) : (Zmax — Zmin) = ~1, 
=; = 6.23 
apne an — tin) : (Emax — Zin) = +1, 4 
где 2; = —1 означает, что }-й фактор запланирован в эксперимен- 


те на нижнем уровне (при Zmin), а 2; = +1— на верхнем уровне 
(при zmax). Заметим, что преобразования (6.23) действительны 
при любых натуральных Х, даже если это качественные события: 
А = 0 = 0 либо А = 2max = 1. 

Теперь исходное уравнение (6.22) записывается в плановом мас- 
штабе с новыми обозначениями: 


У = 0:0 +4121, 


где 2 — так называемый «нулевой» фактор, всегда тождественно 
равный единице, — означает по-прежнему среднее значение У при 
условии 21 = 0 и опускается из записи уравнения как множитель в 
виде единицы, так что уравнение принимает обычный вид: 


у=ао фа. (6.24) 


Но о нулевом факторе не забывают, и он фигурирует во втором 
столбце плана эксперимента. 

В предыдущем разделе было сказано: полный план содержит 
все возможные сочетания уровней контролируемых факторов. В 
модели (6.24) фактор один и у него всего два уровня, которые со- 
четаются с одним и тем же значением +1 для нулевого фактора. 
Кроме этого, нужно хотя бы дважды повторить эксперимент, что- 
бы вычислить остаточную дисперсию и оценить значимость козф- 
фициента регрессии. Следовательно, полный план в этом случае 
должен содержать всего четыре строки: 2'+! = 4; число столбцов 
определяется количеством коэффициентов (их 2 в данной модели), 
плюс столбец с номерами строк (i) и столбец для записи резуль- 
талов измерения (подсчета) значений зависимой переменной у в 
эксперименте. Итак, для простой линейной регрессии (6.24) полу- 
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чаем полный план: 


; (6.25) 


4l+ + 


в котором принято опускать единицы в записи уровней факторов: 
знаков +, — достаточно для последующих расчетов; пунктиром от- 
делена повторяемая для оценки дисперсий часть плана. Заметим, 
что скалярное произведение столбцов нулевого и первого факто- 
ров равно нулю, следовательно, этот план ортогонален, и переста- 
новкой строк можно получить несколько эквивалентных ему пла- 
нов. 
После того как план построен, удобней вместо записи (6.25) за- 
писывать план иначе: 
т |2 2н Ут Yin 
11+ - yu me 
21+ + Yar 92 


— удобней, чтобы усреднять значения у и уз и вычислять диспе- 
рсии условных средних и другие показатели в каждой 1-й строке 
плана. При этом обе записи содержат 4 строки, которые опреде- 
ляют критический объем выборки для выявления коэффициентов 
регрессии (6.24), если, конечно, погрешность (6.21) позволит это 
сделаль. А если не позволит, то следует повторять эксперимент 
по плану до тех пор, пока не станет очевидным отсутствие зави- 
симости (6.24), возможно, из-за существенной нелинейности кор- 
реляции ХУ. 

План простой линейной регрессии служит основой построения 
более сложных планов. Сначала рассмотрим двумерный случай. 
Исходное уравнение регрессии 


‘ (6.26) 


Y= а0 + а121 + 4222 + 4122122 (6.27) 


в этом случае содержит 4 неизвестных коэффициента. Следова- 
тельно, необходимы 2% = 16 строк полного плана. Заметим, что 
количество неизвестных коэффициентов в точности равно N+K-+1, 
где М — число факторов (здесь № = 2), К — число сочетаний фак- 
торов (К = 1), и еще единица связана с необходимостью удвоения 
плана. 

По уравнению (6.27) полный план строится следующим обра- 
зом. Сначала записывается основа из двух столбцов 20;, 2; одно- 
мерного плана (6.25) и к нему справа приписывается столбец для 
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зн, в котором второй фактор в двух первых строках планируется 
на нижнем, а в третьей и четвертой строках — на верхнем уровнях: 


2н 2и 


41+ + + 


Получился линейный бесповторный двумерный план. Повторяя 
этот план для строк 5 - 8, получаем полный линейный план: 


i [29 24 #54 
1|+ - - 
2+ + - 
3+ - + 
4)4+ + + 
5+ - - 
61+ + - 
|+ - + 
81+ + + 


где повторяющиеся блоки разделены пунктиром. 

Далее следует ввести в этот план произведение факторов 21:24, 
которое в математическом планировании рассматривается в каче- 
стве нового фактора, но его уровни определяются произведением 
уровней сомножителей: для первой строки (—) x (-) = (+), для 


второй — (+) x (-) = (-) ит.д., как представлено в следующей 
матрице: 

EP zo; 2н 2н зн 

|+ - - + 

++ - - 

3/4 - + - 

+++ +]. (6.28) 

5|+ - - + 

++ - - 

7+ - + - 

8+ ++ + 


Заметим, что полученный план ортогонален, так как скалярное 
произведение любой пары столбцов равно нулю, в чем легко мож- 
но убедиться. 

Теперь остается удвоить план (6.28), записав ero, opuenmupys 
вертикально, как (6.25), либо горизонтально, как (6.26). Экономя 


место, запишем в удобной горизонтальной ориентации: 


$ | 25 25 25 2525 1 2 
11+ - --+ м 
2+ + = = ya Ya 
3+ - + - шю 
Slee = = Бра (6.29) 
5+ - - + мм 
б ++ - - м 
Я =. —, МЕ 
8+ + + + ver ver 


По этому полному плану можно проводить эксперимент, измерять 
и записывать в числах результаты у;1 и у;2, а потом обрабатывать 
эти данные, как будет показано в следующем разделе. Отметим, 
что перестановкой строк из (6.29) можно получить многообразие 
новых планов для серии повторных экспериментов. 

При увеличении числа контролируемых факторов процедура. 
построения плана эксперимента повторяется. За исходный при- 
нимается N - 1-мерный план. К нему поочередно добавляются: 
сначала №-й фактор, который планируется на нижнем уровне в 
первой половине строк М — 1-мерного плана и на верхнем уров- 
не— в другой половине его строк; затем полученный план повто- 
ряется, сочетаясь с нижним и верхним уровнями комбинации N-ro 
фактора с первым, вторым и комбинациями остальных факторов, 
причем в каждой строке уровень комбинации определяется ал- 
гебраическим произведением знаков предшествующих факторов, 
вошедших в комбинацию. Для оценки правильности полученного 
плана проверяется его ортогональность — вычисляются ковариа- 
ции новых столбцов между собой и с некоторыми, полученными из 
М - 1-мерного плана; это нетрудно: (—) x (+) x (+) x (-) =0,—и 
так для каждой пары строк и столбцов. 

Читатель может потренироваться в построении полного плана 
трехфакторного эксперимента. Этот план должен иметь 256 строк, 
так как уравнение полной трехфакторной регрессии 


У = 40 + 4121 + 6222 + аз23+ 
+ 4122122 + 6132123 + 4232223 + @123212223 


содержит N+K+1 = 3+С3+С3+1 = 3+4+1 = 8 неизвестных коеф- 
фициентов, для определения которых, независимо друг от друга, 
необходимо 28 = 256 измерений. Это не такой уж большой объем 
выборки для исследования по математическому плану: он меньше, 
чем был бы нужен при классическом регрессионном анализе, и го- 
раздо меньше, чем требуется для обычных случайных выборок. 


}}.}. Обработка результатов математически спланированного эксперимента 


Как упоминалось выше, обработка данных эксперимента по пла- 
ну проста и сводится к следующим действиям. 
1. Вычисляются коэффициенты регрессии: 


Daim (6.30) 
т 


rae j = 0,12, ... — порядковый номер коэффициента (и фактора), 
i = 1,2,....п— номер строки плана в вертикальной ориентации 
(6.25), п — общее число строк — объем выборки. Если план запи- 
сан в горизонтальной ориентации (6.26) и (6.29), то формула (6.30) 


преобразуется: 
0,5" в 
в = уе: у + y три. 
1 i=0,5n41 


В обеих формулах, так как значения =; представляют собой «плю- 
сы» или «минусы», вычисление коэффициентов регрессии сводит- 
ся к алгебраическому суммированию результатов измерений и 

2. Вычисляются условные средние арифметические значения. 
Удобнее всего это делать по строкам горизонтально ориентиро- 
ванного плана (6.26) и (6.29): 


Я: =0,5(и + и). (6.31a) 


Менее удобно — по строкам плана, ориентированного вертикаль- 
но, со сдвигом в 0, 5п строк: 


FH =0,5(и + и), (6.316) 


что, например, для однофакторного плана (6.25) при 0,5. = 
означает: J, = 0,5(yi +3), Jo = 0,5(yo+ ya), а для двухфакторного 
плана при 0,5 - 2% = 8: J, = 0,5(y1 + yo), У» = 0,5(у2 + и), ..., 


Ys = 0, 5(ys + и). 
3. Вычисляются условные дисперсии: 
Dy = 0,5(uh + uh) -й (6.32a) 
или 
D; = 0,5 + viyo,s) — BF (6.326) 
для строк горизонтально или вертикально ориентированных пла- 
нов. 
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4. Вычисляется остаточная дисперсия как среднее арифметиче- 
ское из условных дисперсий: 


=) Di, (6.33) 


где О; определены формулами (6.32 а) и (6.326). 
5. Вычисляется стандартная погрешность коэффициентов ре- 
грессии: 


1), (6.34) 


где п = 2N+K+! — число строк полного плана (число измерений, 
объем выборки). 

6. Проверяется значимость коэффициентов регрессии. Значимы 
те коэффициенты, для которых выполняется условие: 


а; > tayo, (6.35) 


где ta,, — квантиль {-распределения Стьюдента, определяемый по 
табл. УШ Приложения 2 для вероятности ошибки 1-го рода а = 
0,05 и числа степеней свободы и = п- 1. 

7. Уравнение регрессии записывается в явном виде со значимы- 
ми коэффициентами; члены с незначимыми коэффициентами от- 
брасываются. Если все коэффициенты окажутся незначимыми, то 
это может быть обусловлено малым числом наблюдений и необхо- 
димо повторить эксперимент; если не помогает, нужно расширить 
зону планирования, уменьшив Zmin и увеличив Imax; если и это не 
помогает, то зависимости, по-видимому, не существует. 

8. Проверяется равенство вычисленных по уравнению и эмпи- 
рических условных средних: 


=, (6.36) 


где У; — вычисленное по уравнению. ‘условное среднее, оно опреде- 
ляется подстановкой в уравнение регрессии тех «плюсов» и «ми- 
нусов», которые означают сочетание уровней факторов в {-Й стро- 
ке плана. Если для многих строк плана равенство (6.36) не вы- 
полняется, то следует проверить, нет ли систематической ошибки 
типа «сдвиг». Проверка предполагает сравнение сумм условных 
средних — эмпирических и вычисленных: если эти суммы равны, 
то систематической ошибки нет, а нарушение равенства (6.36) об- 
условлено флюктуациями эмпирических данных. Для оценки этих 
флюктуаций вычисляют дисперсию неадекватности*. 


*В публикациях по математическому планированию эксперимента се на- 
зывают дисперсией адекватности, что явно противоречит смыслу. 


9. Вычисление дисперсии неадекватности основано на идее ме- 
тода наименьших квадралов, который рассматривался выше. При 
этом используется формула 


0,5 


L_ Soe 
Е Le ~ 4). (6:37) 


Эта дисперсия служит мерой неадекватности полученного уравне- 
ния регрессии для экспериментальных данных. Если при условии 
безошибочности расчетов дисперсия неадекватности относитель- 
но велика, то следует вернуться к изучению ситуции и выбору 
другой, может быть, более сложной модели. 

Пример 6.6. Пусть радист принимает сигналы переменной 
громкости в условиях возможных помех. Требуется оценить, как 
влияют на ошибки приема громкость сигнала и помехи. В экс- 
перименте громкость сигналов и наличие либо отсутствие помех 
можно независимо варьировать — это два контролируемых факто- 
ра. Первый из них варьируется в некотором диапазоне OT Zmin ДО 
тах, а второй — логическая переменная, которая принимает зна- 
чения: «0» — нет помех или «1» — есть помехи. 

В такой ситуации возможны следующие эффекты: 0) ошибки ра- 
диоприема не зависят от громкости сигналов и от помех при вы- 
бранном диапазоне громкостей и качестве помех; 1) они зависят 
только от громкости или 2) только от наличия помех; 3) ошибки 
зависят от совместного действия контролируемых факторов. Te- 
перь можем записать уравнение регрессии в общем виде; 


У = 4020 + @121 + 9222 + @122122, 


Где 20, 21,22 И 2122 — четыре фактора, которые обусловливают пе- 
речисленные выше эффекты; ав, а1, аз 4 а12 — коэффициенты, вы- 
ражающие величину этих эффектов. Первый и второй факторы 
представляют собой контролируемые переменные, которые надо 
преобразовать в плановый масштаб: 


_ [ (ещо — tmax) = (tmax — Zmin) = —1, 
д [о ft Mamata Ftd 


_ f(0-1):(1-0)=-1, 
a (Roo he =+1, 


откуда, опуская единицы, получаем: 21 = (—,+), 22 = (-, +), 
где минус означает нижний уровень факторов, а плюс— верхний 
уровень. Нулевой фактор, означающий среднее из эмпирических 
данных при условии остальных значений в центре планирования, 
всегда положителен. Фактор сочетания первых двух как третий 
фактор — 2122 = 73 — принимает значения, определяемые в каждой 
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строке плана произведением знаков факторов-сомножителей. В 
уравнении обозначение нулевого фактора можно опустить и заме- 
нить произведение факторов на обозначение третьего фактора. 
Перед проведением эксперимента для удобства реализации пла- 
на полезно записать в виде матрицы соответствий сочетания 
‘уровней факторов в плановом и натуральном масштабах: 


Здесь по-прежнему X; = {2min,2max)—Ba уровня громкости, 
Xo = 10,1} — отеузствие или наличие помех, 

Пусть в результате эксперимента по плану (6.29) получены кон- 
кретные значения числа ошибок радиоприема, которые для при- 
мера записаны в столбцы ут, Yi2? 


i [20 25 za zai а | й Г Ш 4 
1|+ - -+ 4 3] 3,5 0,25 4,0 0,25 
27+ + - — 2 37] 2,5 0,25 2,5 0,00 
3/+ - +- 6 4] 5,0 1,00 5,0 0,00 
4/+ + + + 8 10] 9,0 1,00 8,5 0,25 (6.38) 
5+ - - + 4 5] 4,5 0,25 4,0 0,25 
6/+ + - — 3 2] 2,6 0,25 2,5 0,00 
7|+ -+- 4 6] 5,0 1,00 5,0 0,00 
8i+ + + + 9 Т 8,0 1,00 8,5 0,25 
Суммы 40 40| 40,0 5,00 40,0 1,00 


По изложенной выше процедуре и соответствующим формулам об- 
работаем эти данные. 
1. Вычисляем по (6.30) коэффициенты регрессии: 
ао =(+4+3+2+3+6+44+8+104+4+5+3+24+4+6+ 
+9+7):16=5; 
a, =(-4—3+2+3—6-4+8+10-4-5+3+2-4-6+ 
+9+7):16=0,5; 
аз =(-4-3-2-3+6+4+8+10-4-5-3-2+4+6+ 
+9+7):16 = 1,75; 
аз =(+4+3-2-3—6-4+8+10+4+5-3-2-4-6+ 
+9+7) :16=1,25. 


2. Вычисляем по (6.31 а) условные средние арифметические и 
записываем в новый столбец плана (6.38): 


Я =0,5(4+3)+3,5, 9:=0,5(2+3)=2,5 итд. 


3. Вычисляем по (6.32а) условные дисперсии и записываем в 
следующий столбец, приписываемый к плану (6.38): 


D, = 0,5(4? + 31) — 3,52 = 0,25, 
Dz = 0,5(2? +3?) -2,5? =0,25 ит.д. 


4. Вычисляем по (6.33) остаточную дисперсию, суммируя услов- 
ные дисперсии в столбце плана: 


Do = (0,25.4+1,00.4) :8 = 0,625. 


5. Вычисляем по (6.34) стандартную погрешность коэффициен- 
тов регрессии: 


0. = V/0, 625 : (16 — 1) = \/0, 0417 = 0,204 


6. Проверяем no (6.35) значимость коэффициентов регрессии. 
Сначала находим по табл. VIII Приложения 2 пятипроцентный 
квантиль {-распределения Стьюдента при числе степеней свобо- 
ды (16-1); он составляет 2,131. Умножая на него стандартную 
погрешность, получаем критическое значение для оценки коэффи- 
циентов регрессии: 2,131 . 0,204 = 0,435. Все полученные выше 
коэффициенты не меньше этого критического значения. Следова- 
тельно, они значимы на 5%-м уровне. 

7. Теперь можем записать в явном виде уравнение регрессии, 
характеризующее зависимость ошибок радиоприема от громкости 
сигналов и от помех: 


Я =5+0, 521 + 1,7522 + 1,2523. 


8. Вычисляем по этому уравнению предсказываемые им в сред- 
нем ошибки радиоприема и записываем вычисленные условные 
средние И} в дополнительный столбец плана (6.38): 


я $ - 0,5 - 1,75 + 1,25 = 4,0, 
я 5 + 0,5 - 1,75 - 1,2 = 2,5, 
= 5 + 05 + 1,75 + 1,25 = 85. 


Так как имеются отклонения вычисленных условных средних от 
эмпирических, надо проверить, нет ли систематической ошибки. 
Для проверки находим суммы в столбцах 9; и Yj (6.38); они рав- 
ны, следовательно систематической погрешности нет и отклоне- 
ния суть случайные ошибки (флюктуации). 


9. Для оценки качества, регрессионной модели вычисляем по 
флюктуациям, согласно формуле (6.37), дисперсию неадекватно- 


сти: 
Dax = 1/85. A?, 


где А} = (4-3,5)2 = 0,25, A? = (2,5—2,5)? = 0,00 ит. д.; они запи- 
саны в последнем столбце плана (6.38), их сумма равна единице, 
так что Dag = 0,125. Соответственно oxy = /0,1I5 = 0,354, что 
приблизительно равно флюктуациям Ду, результат приемлемый. 
Таким образом, полученная регрессионная модель удовлетво- 
рительна, поскольку воспроизводит эмпирические данные в сред- 
нем со случайной ошибкой порядка +0,4. Коэффициенты регрес- 
сии показывают, что ошибки радиоприема обусловлены главным 
образом помехами и слабыми сигналами на фоне помех, слабость 
сигнала без помех меньше влияет на появление ошибок радиста. 


ГЛАВА |. ОСНОВЫ ФАКТОРНОГО АНАЛИЗА 
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1.1, ПОНЯТИЕ О ФАКТОРНОМ АНАЛИЗЕ 


1.1.1, Сущность факторного анализа 


Яной переменной будем называль величину, которую можно 
непосредственно или косвенно измерить. Например, можно непо- 
средственно измерить длину стола линейкой. Силу электриче- 
ского тока можно косвенно измерить посредством напряженности 
магнитного поля в проводнике. Длина стола, сила электрического 
тока — это явные переменные. Отметим, что при косвенных изме- 
рениях переменной Х через переменную У должно быть известно 
в ABHOM виде уравнение X = /(У). 

Латентной переменной (фактором) будем называть величину, 
которую непосредственно измерить нельзя и для которой неиз- 
вестны уравнения связи с какими-либо явными переменными 
Большинство психических явлений, безусловно, должно рассма- 
триваться как латентные переменные. Во многих случаях мы не 
знаем о них ничего, кроме того, что они существуют и, обусло- 
вливая жизнедеятельность, проявляются в действиях (реакциях) 
индивида. Эти действия представляют собой явные переменные, 
так как их можно объективно измерить, прямо или косвенно. 

Весом (зарядом, откликом) латентной переменной (фактора) у 
i-ro индивида будем называть некоторую количественную меру 
проявления этой латентной переменной в наблюдаемых или спе- 
циально вызываемых действиях (реакциях) данного индивида. 

Тестированием будем называть естественное или специально 
сконструированное воздействие на психику*, вызывающее отклик 
латентного свойства F, который проявляется в объективно реги- 
стрируемом действии 2, где 2 = У(Р), причем вид функции $ 
неизвестен. 

Задание, посредством которого осуществляется тестирование, 
называют тестом. Характер теста может быть любым — это и во- 
прос, требующий ответа, и задача, требующая решения, и неко- 
торая ситуация, требующая определенного комплекса действий, 


*Вообще — на живой организм или физический объект. 


ит.п. Применение теста А; к i-My индивиду вызывает У инди- 
вида реакцию 2;;, которая как-либо оценивается или измеряется. 
Например, ответы испытуемых по тестам шкалы `Векслера оцени- 
ваются суммами баллов. Зарядом (весом) латентной переменной 
(фактора) по j-my тесту будем называть количественную меру вы- 
явления данной переменной с помощью данного теста. 

Обычно психические явления на первичном уровне описания ха- 
рактеризуются группой свойств. Каждое из таких свойств — это 
лалентная переменная. Свойства в группе могут быть соподчи- 
нены, могут различаться по степени общности. В этой связи и 
лалентные переменные, отображающие группу свойств, образуют 
яатектную струхтуру, в которой отдельные переменные могут в 
определенном отношении рассматриваться как общие, групповые 
и специфические. Кроме того, переменные в латентной структуре 
могут быть взаимосвязаны. 

Итак, латентной струхтурой будем называть систему латент- 
ных переменных, характеризующих некоторое психическое явле- 
ние и обусловливающих систему реакций индивида в отьет на си- 
стему внешних воздействий. Иначе говоря, латентная структура 
обусловливает определенное поведение в основных условиях. 

Очевидно, уже по определению латентная структура должна 
рассматриваться в качестве структуры случайной как по харак- 
теру существования и выраженности ее элементов у различных 
индивидов, так и по степени возможности ее тестирования и опи- 
сания. В этой связи факторный анализ как группа методов, на- 
правленных на выявление и описание латентной структуры, бази- 
руется на следующих основных постулатах. 

Постулат 1. Существование латентной структуры полностью 
определимо только на множестве индивидов, образующих гене- 
ральную совокупность. Следствие: лалентная структура отдель- 
ного индивида есть случайная реализация общей латентной струк- 
туры. 

Постулат 2. Латентная структура может проявиться лишь че- 
рез определенное множество тестирований. Следствие: латентная 
структура, выявляемая через неопределенное множество тестиро- 
ваний, есть случайная реализация общей латентной структуры. 

Рассмотрим основные уравнения факторного анализа (ФА). 
Пусть имеется множество индивидов By, где i = 1,2,3,....n, и 
множество тестов* Aj, где j = 1,2,3,...,т, причем каждый тест 
однократно применлется к каждому индивиду, в результале чего 
получается количественная оценка 2; (табл. 7.1). Пусть далее ла- 


'Множество тестов, определенное для выявления латентной структуры, 
обычно называют батареей тестов. 
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тентная структура представлена множеством общих факторов Fy, 
rae у = 1,2,3, 


Таблица 71 
Результаты применения батареи тестов к выборке испытуемых 


Множество индивидов В, 


В; | Bz | В: ose | By |. | Ba 
Ay | aur | 212 | as |... | exe [--- | ein 


Множество | As | 231 | 232 | 223 
(батарея) |... |... |... | -- 
тестов А, | A, 


ата fess | Эт® 


Тогда первое основное уравнение факторного анализа может быть 
записано следующим образом: 


(Fy )bi(Fy), 


у=1 
где 2; — оценка, полученная в результате однократного приме. 
нения j-ro теста к Ему индивиду; а;(Е,) — заряд у-го фактора в 
7-м тесте; (Ру) — вес у-го фактора у t-ro индивида. Величины 
2), а;(Е,) 4 6;(F,) — это обычно величины, центрированные и нор- 
мированные своими стандартными отклонениями* 

Второе основное уравнение факторного анализа может быть 
представлено в нескольких вариантах. Например, оценки 25; в та- 
бл. 7.1 можно коррелировать по строкам или по столбцам. Если, 
используя коэффициент корреляции Пирсона**, определить, как 
коррелируют оценки г; каждого теста с каждым другим (коэф- 
фициент корреляции вычисляется между строками табл. 7.1), то 
второе основное уравнение ФА для каждой пары тестов имеет 
вид 


k 
r(AiAa) = D> a (Fy)a2(Fy), (7.1) 

y= 
т.е. коэффициент корреляции каждого теста с каждым другим те- 
стом рассматривается как скалярное произведение факторных за- 
рядов соответствующей пары тестов. Аналогично, коррелируя 


*На практике чаще всего 2; ие центрируются и не нормируются, фактор- 
ные заряды и веса получают в виде основных отклонений в ходе вычислений. 

**Существо ФА обычно демонстрируют для коеффициента Пирсона, но 
факторный анализ можно осуществлять и на основе коэффициентов ранговой 
корреляции, функционально связанных с пирсоновским. 


тестовые оценки каждого индивида с каждым другим (корреляция 
между столбцами табл. 7.1), имеем второе основное уравнение ФА. 
для каждой пары индивидов: 


Е 
r(BiBa) = УБ(ЕЬ(Е,). (7.2) 
y= 
Необходимо отметить, что уравнение (7.1) справедливо только 
при условии выполнения постулата 1, а уравнение (7.2) — только 
при выполнении постулала 2. 

Из уравнения (7.1) следует, что коэффициент корреляции j-ro 
теста с самим собой — это величина, равная сумме квадратов фак- 

торных зарядов данного теста: 


О 
MASAI) = Са). (7.3) 
у 
Величину г(А;А;) называют «общностью» или запасом общей из- 
менчивости, она представляет собой часть общей дисперсии оцен- 
KM 2); по j-my тесту. 

Полное уравнение дисперсии в нормированном виде может быть 

представлено в виде суммы следующих компонентов: 

1=r(AjAj) + (Е) +22, (7.4) 
где г(А; А;) — запас общей изменчивости; с,(Е;) — заряд фактора, 
специфического для 7-Й переменной; =} — остаточная дисперсия 
оценки 2 по j-My тесту. Уравнение (7.4) — это третье основ- 
ное уравнение факторного анализа. Обозначая г(А;А;) = 17 и 
(Е) + €} = и}, можем переписать уравнение (7.4): 

НШ = 1. 

В факторном анализе существенную роль играет величина Aj, 
которая в подавляющем большинстве случаев априори неизвестна, 
и струдом может быть определена экспериментально*, Величина, 
u}, в сущности, не имеет в ФА какого-либо значения, кроме того, 
что по ней определяется окончание процесса извлечения факторов. 
Тем не менее на практике ее компонент =} всегда присутствует, и 
ero следовало бы суммировать с уравнениями (7.1) и (7.2): 


С 
(А: Аз) = У`ак(Еуаз(Е,) +162, (7.5) 


yal 


*Козффициеит корреляции тесть с самим собой известен как коэффициент 
оэкачевлентиости в случае, если два эквивалентных тесть применяются од- 
мовременно x одной и той же группе людей, или как коэффичмент стабильно. 
сту, когда один и тот же тест применяетсл к двум еквивалентным группам. 
‘индивидов. 
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где Е1=2 — остаточный коэффициент корреляции, обусловленный 
флюктуациями условий тестирования; 


Е 
r(B1B2) = Увы (ЕВ (Е) + вле» 
vt 
где €)€2 — остаток, обусловленный флюктуациями внутренней сре- 
‘ды организма. 

На основании левых частей уравнений (7.4) и (7.5) может быть 
написана матрица коэффициентов корреляции*, в которой по глав- 
ной диагонали записаны единицы. Такая корреляционная матрица. 
называется в ФА «комплектной». Корреляционная матрица, у ко- 
торой по главной диагонали расположены запасы общей изменчи- 
вости (по (7.3)), называется «сокращенной». Пример комплектной 
и сокращенной корреляционных матрии приведен в табл. 7.2. 


Таблица 7.2 
Комплектная и сокращенная корреляционные матрицы 
Комплектная Сокращенная 
Lome ms та tis НЗ па mis ma ть 
та 1 газ 124 725 та № та та ras 
T31 732 \ 74 тэ Ta 1732 в 4 тзь 
та та та т otas | [та таз таз № тв 
ты та тва ты 1 ты 752 sa ты М 


Факторная (лалентная) структура, выявляемая по множеству 
переменных (тестов или индивидов), может быть представлена в 
виде матрицы факторных зарядов**, в которой по строкам указаны 
переменные (тесты или люди), а по столбцам — факторы. Строка, 
факторной матрицы представляет факторную структуру перемен- 
ной, столбец— структуру переменных, измеряющих данный фак- 
тор. Как указывалось, факторы в латентной структуре могут быть 
общими, групповыми и специфическими. Чаще всего в ФА рассма- 
триваются латентные структуры, имеющие в своем составе только 
общие и специфические факторы***. Факторная матрица, включа- 
ющая в себя как общие, так и специфические факторы, тоже назы- 
вается комплектной. Соответственно матрица, включающая в се- 
бя только общие или только специфические факторы, называется 
сокращенной. Пример комплектной и сокращенной факторных ма- 
триц приведен в табл. 7.3. Отметим, что матрица специфических 
факторов — это диагональная матрица. 


*В дальнейшем, для краткости, просто корреляционная матрица. 
“*Coxpamenno фахтормал матрица. 
При этом общие факторы в дальнейшем специальными методами (ро- 
тации) «расщепляют» до групповых. 
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Таблица 7.3 
Комплектнал и сокращенные факторные матрицы 


Общие факторы Ру | Специфические факторы С; 
ха 3 r[2]3]a4 5 

1 | аз | а12 a3 си 

2 | a2: | а22 @a3 oI 

Тесты А, | 3 | азз | аз | аз» сз 

3 | ваз | 942 243 с 

$ [ ава | а52 в53 3s 

Сокращенная Сокращенная 

Комплектная 


Обобщая второе и третье основные уравнения (7.1) и (7.4), мо- 
жем записать общее основное уравнение факторного анализа в ма. 
тричной форме: 


` 
№ = `В, +С+Е при 


= 
Ry =F,F, 


Здесь Во — исходная, обычно комплектная корреляционная матри- 
ца, получаемая эмпирически; К, — так называемая у-я (первая, 
вторая ит. д.) корреляционная матрица, получаемая в результате 
у-го шага ФА; у— порядковый номер шага ФА, у= 1,2,...,К, где 
{ — количество общих факторов в латентной структуре и одновре- 
менно — число шагов по извлечению факторов*; Ру — сокращенная 
факторная матрица, полученная в результате у-го шага и содер- 
жащая один у-Й столбец факторных зарядов; Р, — транспозиция 
матрицы Fy, содержащая одну строку; С — диагональная матрица 
специфических факторов; Е — матрица ошибок. 

Сущность любого из методов факторного анализа состоит в 
том, чтобы, преобразуя последовательно шаг 3a шагом исходную 
корреляционную матрицу Ro, выделить из нее сокращенную фак- 
торную матрицу Fy, такую, чтобы выполнялось равенство** 


Во = РЬР, + Е, 


(7.6) 


*На каждом шаге извлекается один фактор, поэтому количество факторон 
и число шагов одинаковы. 

“”Это равенство часто и называют в нашей литературе основным урав- 
нением ФЛ. 


где в матрице Е все элементы Ех; не отличались бы сталистически 
значимо от нуля. 


1.1.1. Разновидности методов факторного анализа 


Методы ФА можно классифицировать по крайней мере по трем 
основаниям: по направленности, по исходным представлениям о 
числе общих факторов, по исходным представлениям об ортого- 
нальности факторов. 

Направленность ФА связана с объектом, в котором исследуется 
латентная структура, и с условиями, при которых она изучает- 
ся. В качестве объекта ФА могут выступать множество тестов, 
множество индивидов, множество случаев. Эти три переменные 
в сочетаниях по две (табл. 7.4) и по две перестановки в каждом 
сочетании (табл. 7.5) образуют шесть видов («техник») ФА. Рас- 
смотрим подробнее, в чем суть шести вариантов ФА, так как это 
методологически и методически очень важно. 


Таблица 74 
Сочетания переменных и виды ФА 
Виды | Тесты | Индивиды | Случаи 
Intl | т п 1 
Ши У | т 1 п 
Уим | 1 т n 
Примечание. тип ие единичные множества. 
Таблица 7.5 


Направленность видов ФА. 


Тесты | Индивиды | Случаи 


Тесты = т TI 
Индивиды | И - У 
Случьи | IV м Е 


Примечание. Таблица, как любая матрица, читается на- 
зиная со строки. По строкам расположены переменные, вы- 
ступающие в качестве объекта исследования; по столбцам — 
переменные, опосредствующие изучение объектов. 


I вид ФА в сущности «калибрует» батарею тестов на репре- 
зентативной выборке индивидов. При этом обычно требуется вы- 
полнять условие: т « п— число тестов гораздо меньше числа 
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индивидов. Здесь попарно коррелируются тестовые оценки, по- 
лученные усреднением по выборке людей, и выявляется матрица 
факторных зарядов по тестам. 

I] вид ФА направлен на изучение выборки индивидов, не обяза- 
тельно репрезентативной, но обязательно с помощью представи- 
тельной батареи тестов. При этом обычно требуется, чтобы число 
индивидов было меньше числа тестов: т > п. Но это требование 
далеко не всегда легко, а главное целесообразно выполнять, так 
как часто возникает необходимость изучить для большой груп- 
пы людей ограниченный круг свойств, тестируемых, естествен- 
но, ограниченным набором тестов. Здесь попарно коррелируются 
индивидуальные оценки, усредненные по множеству тестов, и вы- 
является матрица факторных весов по индивидам. 

Еще раз подчеркнем различие между | и И видами, которые 
наиболее распространены на практике. Если | вид ФА отвечает 
на вопрос о том, как хорошо каждый тест (и батарея тестов в це- 
лом) выявляет некую латентную структуру, то Il вид ФА отвечает 
на вопрос о том, в какой мере переменные латентной структуры 
выявляются у данного индивида. 

Считается, что если ФА выполняется на одном и том же масси- 
ве данных (см. табл. 7.1), то 1 и И виды ФА приводят примерно 
к одной и той же факторной матрице. Различие остается лишь в 
интерпретации, согласно указанной специфике этих видов ФА. В 
этой связи отметим, что и между остальными парами видов (Ши 
ТУ, Уи VI) отношения формально такие же. Поэтому иногда чет- 
ные виды называют «обратными» в отношении их нечетной пары. 

Ш и IV виды ФА осуществляются на одном индивиде. Если Ш 
вид ФА отвечает на вопрос, какова стабильность каждого теста (и 
батареи в целом) при многократном применении к одному и тому 
же индивиду, то ГУ вид ФА отвечает на вопрос, какова роль повто- 
рений в выполнении индивидом каждого теста. Здесь вообще по- 
средством факторных матриц исследуется как бы динамика тесто- 
вых оценок (Ш вид ФА) либо изменчивость латентной структуры 
индивида на множестве случаев (IV вид ФА). Оба эти вида имеют 
большое значение для дифференциальной психологии. К сожале- 
нию, их применение наталкивается на значительные трудности в 
связи с тем, что большинство современных тестов не допускает 
(из-за простоты) повторных, тем более многократных применений 
к одному и тому же человеку. 

Уи У! виды ФА осуществляются на одном тесте, многократно 
применяемом ко множеству индивидов. При этом вскрывается ли- 
бо динамика латентной структуры от случая к случаю (У вид ФА), 
либо роль случая (повторения) в изменчивости латентной струк- 
туры у множества индивидов (VI вид ФА). Хотя эти два вида ФА 


почти не используются, сам методологический подход тривиален 
для психологических наук, в которых повсеместно осуществляется 
в эксперименте многократное применение одного и того же зада- 
ния ко множеству испытуемых. 


По исходным представлениям о количестве общих факторов в 
корреляционной матрице Во исторически выделились три вида 
ФА: однофакторный (по Спирмену), бифакторный (по Холзинге- 
ру), мультифакторный (по Терстоуну). В настоящее время счита- 
ется доказанным, что полная матрица интеркорреляций порядка, 
т может быть факторизована бесчисленным количеством спосо- 
бов с выделением (теоретически) не менее т факторов. Несмотря 
на это, во многих случаях оказывается выгодным использовать бо- 
лее простые одно- и бифакторные модели ФА, дающие сходные с 
мультифакторным анализом результаты. Ниже мы подробно рас- 
смотрим однофакторный и мультифакторный методы. 


С точки зрения исходных представлений об ортогональности 
факторов выделяются два вида ФА: с ортогональными (незави- 
симыми) факторами и с облическими (зависимыми) факторами. 
Это, в сущности, разновидности мультифакторного анализа. Их 
специфику мы рассмотрим в дальнейшем. 


1.1.1, Задачи факторного анализа в психологии 


Обычно выделяют две основные задачи ФА в психологических 
исследованиях: во-первых, вскрыть латентную структуру и, во- 
вторых, вскрыть ее так, чтобы она описывалась небольшим чи- 
слом переменных по сравнению с исходным количеством измеря- 
емых переменных. Но в аспекте шести рассмотренных видов ФА, 
различающихся направленностью, можно сформулировать зада- 
чи более конкретно, как мы это и сделали. Повторим здесь еще 
раз три из них, основные, по современным возможностям. 


1. Определить степень пригодности батареи тестов для выявле- 
ния некоторой латентной структуры и шкалировать эту батарею. 


2. Определить выраженность некоторой латентной структуры у 
каждого индивида, из выборки индивидов. 


3. Определить динамические особенности некоторой латентной 
структуры на основе многократного повторного тестирования од- 
ного индивида либо многократного применения одного теста к 
множеству индивидов. 


Решение этих задач является актуальным в настоящее время во 
всех отраслях психологии. 


1.1, ОДНОФАКТОРНЫЙ АНАЛИЗ 


Метод однофакторного анализа предложен Ч. Спирменом в хо- 
де обоснования «теории двух факторов» — общего (генерального) 
и единичного. Комплектная матрица факторов no Спирмену пред- 
ставлена в табл. 7.6. Из таблицы следует, что все показатели (те- 
сты, люди и т.д.) имеют отличающиеся от нуля заряды общего 
фактора (отсюда и название «общий») и, кроме того, — по одному 
специфическому фактору. 


Таблица 7.6 
Однофакторная модель по Спирмену 
Факторы 
Показатели 
общий | единичные 

1 a а: 

2 аз са 

з а 6 

” an &n 


Процедура извлечения факторных зарядов (факторизации} по 
методу Спирмена относится лишь к общему фактору и состоит из 
трех этапов 

На первом этапе для каждой }-й переменной вычисляются заря- 
ды а; общего фактора по следующей формуле: 


_ f= (2), 
oY aa" 


где (г); — сумма всех коэффициентов корреляции в j-M столбце со- 
кращенной корреляционной матрицы (элементы главной диагона- 
ли считаются неизвестными и не входят в суммы); (г}} — квадрат 
предыдущей суммы; (r?); — сумма квадратов всех коэффициентов 
корреляции в 7-м столбие сокращенной корреляционной матрицы; 
(г), — сумма всех коэффициентов корреляции в сокращенной кор- 
реляционной матрице. Определенные таким путем факторные за- 
ряды а; образуют сокращенную факторную матрицу F, в которой 
всего один столбец и п строк (по числу переменных: j = 1,2,...,n), 

На втором этапе ФА по методу Спирмена осуществляется транс- 
понирование факторной матрицы-столбца. ‘Транспонированная 
матрица F’ содержит одну строку с п столбцами. Далее, согласно 
уравнению (7.6), определяется «репродуцированная» сокращен- 
ная корреляционная матрица 


Ri = ЕЁ’, 
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каждый элемент которой вычисляется по формуле 

The = jak, (7.8) 
rae т, — репродуцированный коэффициент корреляции; а; — фак- 
торный заряд 1-й переменной, а, — факторный заряд {-й перемен- 
ной (j = 1,2,....п; F=1,2,--..05 18). 

Третий этап процедуры состоит в определении «остаточной» 
корреляционной матрицы и проверке возможности рассматривать 
остаточную матрицу как матрицу погрешностей. 

Остаточная корреляционная матрица определяется как разность 
между исходной и репродуцированной корреляционными матри- 
цами: 

Ry = Ю-В, (7.9) 
где Ro — исходная, Ri — репродуцированная, Ry — остаточная кор- 
реляционные матрицы. Обозначив элементы остаточной матрицы 
Гук, напомним, что они находятся для каждой пары элементов тук 
ит по уравнению 


Fie = rye — Te: (7.10) 
Далее требуется осуществить проверку равенства 
№=Е, 1.11) 


где Е— матрица погрешностей. При проверке обычно исходят из 
того, что в остаточной матрице, если OHA ‘действительно образова- 
на погрешностями, остаточные коэффициенты корреляции Тук рас- 
пределены нормально, со средним значением, равным нулю. Сле- 
довательно, достаточно определить стандартное отклонение Oy и 
проверить, как велика вероятность того, что максимальное значе- 
ние остаточного коэффициента корреляции не превзойдет выбран- 
ной заранее величины toy Or? 


Р(|Рук[шьх < tayv tr) (7.12) 


Здесь |Иук| шах — максимальный (по модулю) из остаточных коэф- 
фициентов корреляции; ta/y — квантиль распределения Сльюден- 
та при заданной вероятности ошибки первого рода (а) и данном 
числе степеней свободы (v). Если вероятность (7.12) достаточ- 
но велика, то отличие |Рь; [пах OT нуля можно рассматривать как 
случайное, и, следовательно, для всех [Fe] < [ушах ЭТО тем бо- 
лее справедливо. Тогда можно принять, что (7.11) выполняется, и 
остаточную матрицу считать образованной погрешностями изме- 
рения. 

Практически значение ty/, в случае ФА принимают равным еди- 
нице. Тогда, учитывая, что для нормально распределенной пере- 
менной Х 


P(\X| < ox) = 0,683, 
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ограничиваются проверкой условия 
WFyalmax < or. (7.13) 


Если оно выполняется, TO остаточную матрицу считают за ма- 
трицу погрешностей; если же оно не выполняется, то значит, в 
остаточной матрице наряду с погрешностями содержался заряды 
других общих факторов (по крайней мере одного), которые можно 
извлечь другими методами факторного анализа. 

Величину о; можно определить двумя способами. Первый осно- 
ван на уравнении 


5+8M, +2М2 
2N : 


Здесь М, — малемалическое ожидание величины коэффициентов 
корреляции в исходной корреляционной матрице (Ro): 


в: = (1-М,) 


(7.14) 


где (rye): определено выше как сумма всех коэффициентов корре- 
ляции в сокращенной корреляционной матрице; л — число пере- 
менных; п(п — 1) — число коэффициентов корреляции в сокращен- 
ной корреляционной матрице; № — количество испытуемых (в об- 
щем случае — число пар коррелируемых значений). Второй спо- 
соб основывается на более простой формуле: 


I 


“, 


(7.15) 


По уравнению (7.15) о, получается примерно на 20% меньше, чем 
по уравнению (7.14). Следовательно, второй способ накладыва- 
ет более жесткие ограничения на возможность выполнения нера- 
венства (7.13), а также является более простым с вычислительной 
стороны, поэтому он предпочтителен. 

Рассмотрим теперь процедуру однофакторного анализа на при- 
мере, 

Пример 7.1*. В исследовании индивидуальных различий при 
запоминании разных видов материала изучались следующие шесть, 
видов заучиваемого материала: 1) картинки, 2) слова конкретные, 
3) слова абстрактные, 4) числа двузначные, 5) числа трехзначные, 
6) бессмысленные слоги. Оценкой служило количество повторе- 
ний, потребовавшихся для полного запоминания. 


«“Заимствоваи из кн: Теплов Б.М. Простейшие способы факторного 
аньлиза// Типологические особенности высшей нервной деятельности че- 
повека. T.V. М., 1967. 


Ряды оценок, полученных для 32 испытуемых, коррелировались 
для каждой пары видов заучиваемого материала. Сокращенная 
корреляционная матрица порядка. 6 представлена в верхней части 
табл. 7.7. В нижней части таблицы записаны промежуточные и 
окончательные данные, соответствующие формуле (7.7). 


Таблица 7.7 


Исходная корреляционная матрица, промежуточные и окончательные 
‘данные факторизации к примеру 7-1 


Показатели | 1 48 [6 
- [58| 0,24 | 0,33 | 0,38 | 0,43 


1 

2 0,48 - 0,57 | 0,56 | 0,43 0,59 

3 0,24 0,57 0,37 | 0,40 | 0,56 

4 0,33 0,56 | 0,37 - 0,49 } 0,50 

5 0,38 0,43 | 0,40 | 0,49 - 0,61 

6 0,43 0,59 | 0,56 | 0,50 | 0,61 - 

(r); 1,86 | 2,63 |2,14 |2,25 | 2,31 | 2,69 
(г): = 13.88 
ая 3,460 | 6,917 | 4,580 | 5,062 | 5,336 | 7,236 
(2); 0,726 | 1,402 | 0,993 | 1,050 | 1,102 | 1,469 
Числитель 2,734 | 5,515 | 3,587 | 4,012 4,234 | 5,767 
(2), 3,72 |526 |4.28 |4,50 |4,62 |5,38 
Знаменатель | 10,16 |8,62 |9,60 | 9,38 |9,26 | 8,50 
a 0,269 | 0, 640 | 0,374 | 0,428 | 0, 457 | 0,678 

a, 0,52 | 0,80 | 0,61 0,65 | 0,68 | 0,82 


Сокращенная факторная матрица, Е представлена в табл. 7.8. 
'Умножая, согласно (7.8), матрицу F на ее транспозицию F’, полу- 
чаем репродупированную матрицу Ry, она представлена в 
табл. 7.9. Далее, вычитая, согласно (7.9) и (7.10), матрицу В: из 
исходной корреляционной матрицы Во, получаем остаточную кор- 
реляционную матрицу Ro, приведенную в табл. 7.10. Выполним 
для этой матрицы проверку условия (7.11). С этой целью двумя 
способами — по (7.14) и (7.15) — вычислим of. 

Сначала определим оценку математического ожидания M, для 
исходной корреляционной матрицы: 


Тогда 


Таблица 7.8 
Сокращенная факторная матрица 
к примеру 7.1 


Показатели | Заряды общего 


Таблица 7.9 
Репродуцированная корреляционная матрица к примеру 7.1 
Показатели [1 [2 [3 [4] 5 | 6 
? ~ [0,42 [0,32 [0,34] 0,38 [0,43 
2 0,42 - 0,49 | 0,52 | 0,54 | 0,66 
3 0,32 | 0,49 - 0,40 | 0,42 | 0,50 
4 0,34 | 0,52 | 0,40 - 0,44 | 0,53 
5 0,35 | 0,54 | 0,42 | 0,44 = 0,56 
6 0,43 | 0,66 | 0,50 | 0,53 | 0,56 - 


Таблица 7.10 
Остаточная корреляционная матрица к примеру 7.1 


Показатели | 1 2 3 


1 - 0,06 | -0,08 
2 0,06 | - 0,08 
3 —0,08 | 0,08| — 

4 —0,01 | 0,04 | -0,03 
5 0,03 | 0,11 | -0,02 
6 0,00 | -0,07 | 0,06 


Максимальное абсолютное значение остаточного коэффициента 
корреляции из табл. 7.10 составляет 0,11. Следовательно, усло- 
вие (7.11) выполняется. По второму способу с, = wit > 0,18, и 
условие (7.11) тоже выполняется. Тем более все другие остаточ- 
ные коэффициенты корреляции в табл. 7.10 ‘удовлетворяют этому 
условию. Следовательно, мы можем считать остаточную корре- 
ляционную матрицу матрицей погрешностей, а процесс фактори- 
зации законченным. 

Итак, выделен единственный общий фактор, интерпретируемый 
по смыслу переменных как «фактор опосредствованного, осмы- 
сленного запоминания». 


1.1. МУЛЬТИФАКТОРНЫЙ АНАЛИЗ 


1.11. Геометрическая интерпретация корреляционной и факторной матриц 
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Мультифакторный анализ в основе своей разработан Л.Тер- 
стоуном и базируется на предположении о наличии в любой кор- 
реляционной матрице более чем одного общего фактора, а также 
групповых и специфических факторов. Мультифакторная модель 
была представлена выше, в табл. 7.3 (для трех общих факторов). 
Именно для мультифакторного анализа справедливо в общем виде 
основное матричное уравнение ФА — уравнение (7.6). 

В отличие от однофакторного мультифакторный анализ не ис- 
черпывается процессом факторизации, а включает в себя еще одну 
ступень, так называемую ротацию. Кроме того, процесс фактори- 
зации здесь является многошаговым, и число шагов факторизации 
определяется рядом обстоятельств, требующих дополнительного 
объяснения. В этой связи, прежде чем переходить к конкретному 
рассмотрению процедуры одного из наиболее распространенных 
методов мультифакторного анализа — центроидного, — необходи- 
мо дать геометрическую интерпретацию корреляционной и фак- 
торной матриц. 

Коэффициент корреляции г; между переменными i и } интер- 
претируется следующим образом: 


rij = 41) cos ays, 


где №; — длина вектора, изображающего i-10 переменную; hj — 
длина вектора, изображающего j-10 переменную; а;; — угол между 
векторами h; и №;. Запас общей изменчивости для {-Й переменной 
на основании (7.16) можно представить как 


rij = №2 cos aii, 


где сова = (ан = 0), т.е., иначе говоря, каждую переменную 
можно охарактеризовать величиной вектора / < 1, определяемого 
как положительное значение корня квадратного из запаса общей 
изменчивости по данной переменной. Таким образом, зная или 
как-либо определяя запасы общей изменчивости по всем перемен- 
ным, можем определить значения векторов, характеризующих эти 
переменные. Далее, пользуясь уравнением (7.16), в котором для 
каждой пары переменных известны значения гу, а также № и h;, 
можем вычислить 


откуда находится и угол ау;. 
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Система векторов, длина каждого из которых определяется эле- 
ментами главной диагонали, а углы между каждой парой кото- 
рых — остальными элементами корреляционной матрицы, называ- 
ется конфигурацией векторов. Из сказанного ясно, что каждой со- 
кращенной корреляционной матрице однозначно соответствует не- 
которая конфигурация векторов, и наоборот*. 

Факторная матрица геометрически интерпретируется следую- 
щим образом. Исходным является предположение об ортогональ- 
ности факторов. Каждый фактор рассматривается как вектор еди- 
ничной длины, ортогональный всем другим таким же векторам. 
Таким образом, факторы образуют прямоугольную систему коор- 
динат (систему соотнесения), число осей в которой равно числу 
столбцов в сокращенной матрице факторов. Очевидно, что при 
более чем трех факторах наглядное изображение системы коор- 
динат невозможно, но обычно используется двумерное плоскост- 
ное представление для всех пар осей. Факторные заряды 1-й пе- 
ременной геометрически интерпретируются как проекции вектора. 
‘данной переменной на соответствующие координатные оси. Такая 
интерпретация основана на представлении факторного заряда как 
коэффициента корреляции данной переменной с данным фактором 
и, следовательно, на представлении этого коэффициента корреля- 
ции как косинуса угла между вектором переменной и соответству- 
ющей осью координат. 

„Дадим для примера геометрическую интерпретацию сокращен- 
ной факторной матрицы, представленной в табл. 7.11, — рис. 7.1. 
Двум факторам, которые считаются независимыми, поставлены в 
соответствие две перпендикулярные оси единичной длины. Что- 
бы получить конфигурацию векторов, воспользуемся факторными. 
зарядами из табл. 7.11. Первый вектор имеет факторные заряды 
0,7 и 0,3. Следовательно, конец первого вектора в координатах 
Ри, Её — это точка с координатами (0,7;0,3). Геометрически пер- 
вый вектор находим, соединяя эту точку с началом координат. 
Аналитически длину вектора hy определяем по теореме Пифаго- 
ра: 


hf = 0,7? +0, 3? = 0,58, 


hy = 0,58 = 0,76. 


Первое из этих двух уравнений еще раз поясняет смысл запаса об- 
щей изменчивости как суммы квадратов факторных зарядов дан- 
ной переменной. Аналогично определяем длины остальных век- 
торов переменных, изображенных на рис. 7.1. Можно видеть, что 


Разумеется, ото не снимает вопрось о статистической достоверности как 
‘самой корреляционной матрицы, так и конфигурации ее векторов. 


конфигурация векторов задана в сокращенной факторной матрице 
посредством системы координат и факторных зарядов. 


Таблица 7.11 
Сокрашенная факторная матрица 


Переменные 


0 02 34 68 08 40° 


Puc. 7.1. Факторнья структура (табл. 7.11) 
А и В первый и второй факторы соответственно; 
1-4— векторы переменных 


Таким образом, факторная структура, геометрически интерпре- 
тирующая факторную матрицу, объединяет конфигурацию векто- 
ров с системой координат. Вся сложность вопроса, однако, состо- 
ит в том, что в корреляционной матрице система, координат зара- 
нее никак не определена: не определены ни число факторов (осей 
соотнесения), ни величины факторных зарядов. Методов факто- 
ризации существует много, и в результате каждого получается 
факторная матрица, по-своему ориентирующая координатные оси 
относительно конфигурации векторов. Из рис. 7.1 легко видеть, 
что, вращая систему координат вокруг начала отсчета, можно 


nox 

BS rae бесконечное разнообразие проекций конфигурации век- 

ны следовательно, существует бесконечно 

ество факторных матриц, о: J 
‚ отличающихся 
ней мере величинами ¢: qe 
акторных зарядов (не го 
осей). Очевидно, чтоб; ее. 
4 ы избавиться от мно; 

ей жества решений, не- 

AMMO наложить какие-то ограничения, позволяющие выбрать 


одно единственное решение. Э. 
. Это в мульти. 
достигается путем ротации. с 


1.1.1. Центроидный метод факторизации 
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Среди других методов центроидный метод факторизации явля- 
ется весьма распространенным. Он предполагает, что каждая 
ось соотнесения проводится через «центр тяжести» конфигурации 
векторов, отсюда и название метода. Смысл центроидного метода 
поясняется на рис. 7.2. Рассматривая окончания векторов в кон- 
фигурации как систему материальных точек, можно определить 
центр тяжести (центроид) этой системы (точка 51 на рис. 7.2). 
Тогда ось первого фактора проводится через две точки: начало 
конфигурации векторов (точка 0) и точку 51. 


fe 


“fy 


Puc. 7.2. Геометрическая интерпретация центроидного метода. 
51 — центроид конфигурации векторов 1-6; Fj —ось первого факто- 
ра, Е — ось второго фактора. 


В случае если мы имеем дело с двумерной системой латент- 
ных переменных, в которой конфигурация векторов лежит в од- 
ной плоскости, алгебраическая сумма проекций векторов на ось 
второго фактора (Fz на рис. 7.2), перпендикулярную к первой и 
лежащую в той же плоскости, будет равна нулю. Такое положе- 
ние системы координат называется центроидным. Отсюда про- 


исходят специальные термины: центроидный метод, центроидные 
факторы, центроидная ось. 

Алгоритм факторизации центроидным методом имеет цикличе- 
скую структуру, в которой столько циклов (шагов), сколько общих 
факторов можно извлечь из корреляционной матрицы, согласно 
уравнению (7.6). Каждый цикл (кроме последнего) состоит из че- 
тырех этапов. Первые три по смыслу те же, что и при однофак- 
торной модели, а четвертый обусловлен спецификой центроидного 
метода мультифакторной модели. 

Первый этап— извлечение i-ro фактора— осуществляется по 
уравнению 


1 
a= Do, (7.17) 
spb 


где aj; — заряд i-ro фактора в ]-й переменной; >; т; — сумма ко- 
эффициентов корреляции в j-M столбце, включая запас общей из- 
менчивости h?; Т — сумма всех коэффициентов корреляции в ма- 
трице, включая запасы общей изменчивости. Лля проверки вычи- 
сляют So; а; и проверяют выполнение приближенного равенства 
Ly ay = УТ. 

Из формулы (7.17) с очевидностью следует, что исходная кор- 
реляционная матрица должна удовлетворять следующим требо- 


ваниям: 
У #0, 
i 


T>0, h}>0 для всех j. 


(7.18) 


Кроме того, необходимы точные значения запасов общей изменчи- 
вости #2, которые существенно влияют на величину а‹;. Требова- 
ния (7.18) выполнить нелегко. Во-первых, как мы видели (рис. 7.2), 
после извлечения каждого центроидного фактора D>; 7; = 0. Во- 
вторых, даже исходная корреляционная матрица может содержать 
такое количество отрицательных значений туу, что Т будет отри- 
цательным. В-третьих, мы заранее не знаем точных значений 1}. 

Чтобы выполнялись первые два условия из (7.18), к осталоч- 
ной матрице всегда, а к исходной — по необходимости применя- 
ется специальное преобразование («обращение») матрицы*. Что- 
‘бы выполнить третье условие из (7.18), надо приближенно (но как 
можно лучше, точнее) определить значения #1. С этого обычно и 
приходится начинать первый этап факторизации. 


Оно все-таки “alle применяется к остаточным матрицам, поетому мы 
рассматриваем его как составляющее четвертый этал факторизации. 


‚Для определения запасов общей изменчивости существует не- 
сколько методов. Простым и наиболее употребительным является 
метод наивысшей корреляции. Он состоит в том, что в качестве А? 
принимается абсолютная величина максимального ковффициента, 
корреляции в 1-м столбце. Основанием служит тот факт, что дли- 
на вектора с наибольшим приближением определяется через его 
проекцию на ближайший к нему вектор. Точность метода, однако, 
зависит от порядка матрицы и характера распределения значе- 
ний коэффициентов корреляции в столбце. Лля матриц порядка 
более 10 этот метод считается достаточно хорошим. Метод наи- 
высшей корреляции дает переоценку запаса общей изменчивости в 
столбцах с относительно большим числом низких коэффициентов 
корреляции и дает недооценку №} в столбцах с большим числом 
высоких ху. В случае если значения (11)*, вычисленные после из- 
влечения всех общих факторов, значительно отличаются” от ис- 
ходных, определявшихся по методу наивысшей корреляции, проце- 
дуру факторизации повторяют заново, взяв в качестве исходных 
значения (A})*. Этот процесс повторяется столько раз, сколько 
‘необходимо для «сходимости» значений (Aj) к некоторой посто- 
янной величине (пределу), принимаемой за «истинное» значение 
1}. 

Второй этап — получение репродуцированной и остаточной ма- 
триц— выполняется так же, как и при однофакторной модели, 
Согласно уравнению (7.8), умножая каждый элемент факторной 
матрицы-столбца, вычисленной на у-м шаге, на каждый элемент 
ee транспозиции (матрица-строка), получают репродуцированную 
матрицу у-го шага. Далее поэлементно по уравнению (7.10) опре- 
деляют у-ю остаточную матрицу. Важно отметить, что диаго- 
нальные элементы (#7); записываются отдельно, a в остаточной 
матрице по главной диагонали располагают опять максималь- 
ные по абсолютной величине значения остаточных коэффициентов 
корреляции соответствующих столбцов. Правильность вычисле- 
ний проверяют приближенным выполнением равенства 5), 7; > 0 
для каждого столбца. остаточной матрицы. Геометрическая ин- 
терпретация остаточной матрицы дана на рис.7.3: перенося нача- 
ло отсчета в центроид 51, получают новые значения векторов (Ha 
рисунке изображены пунктиром). 

Третий отап— проверка возможности дальнейшего извлечения 


“Tax как №? имеет смысл дисперсии, то проверить, существенно ли или 
случайно отличаются величины A? = [rijhnax м (№2)", можно, используя 
дисперсионное отношение Фишер: Руд, = 52/2)" при № > (М) и 
Frat fasta = (®)* [АЗ при № < (№) 
лировьнных пар. 
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Рис. 7.3. Геометрическая интерпретация остаточной матрицы. 
С переносом начьль отсчета из точки 0 в центроид 51 изменяется 
длина векторов 1-6, которые в новой системе отсчета обозначены 
пунктиром. Видно, что длины векторов уменьшаьются пропорцио- 
нально уменьшению их проекции на ось Ру, но при этом проекции 
на ось F) не изменяются. 


факторов — тоже выполняется аналогично однофакторной модели 
Спирмена. Здесь чаще всего используются, во-первых, уже рас- 
смотренный критерий (7.15), причем считается, что факторизацию 
можно продолжать, если произведение двух максимальных фак- 
торных зарядов у-го фактора по крайней мере вдвое больше o,*, 
во-вторых, специальный критерий Саундерса и, в-третьих, урав- 
нения Терстоуна. 

Использование критерия Саундерса сводится к следующему. 
Вычисляются три величины: 

B= (<4), 
n 


2n 
1 2 
cot (n- =). 
x ("De 


*Cornacno В. Д.Небылицыму, or = py, но, очевидно, при М < 100 лучше 
использовать уравнение (7.15). 


А= 


(7.19) 
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где п — число переменных; М — число скоррелированных пар (объ- 
емвыборки); у— количество общих факторов, выделенных за у ша- 
гов факторизации; Fj; — остаточные коэффициенты корреляции по- 
сле извлечения у-го фактора Fy; Ly ij — сумма квадралов F;; (без 
запасов общей изменчивости) во всей остаточной матрице; Fy; — 
факторный заряд у-го фактора в {-Й переменной; ));, 22; — сумма 
квадратов всех факторных зарядов в матрице факторов после из- 
влечения у-го фактора. Далее проверяется условие Саундерса: 


факторизация закончена, если А< ВС, 


факторизацию следует продолжать, если А> ВС. (1.20) 


Jina прекращения факторизации и для априорного определения 
порядка корреляционной матрицы, необходимой для извлечения 
т факторов, Л. Терстоуном предложены уравнения, связывающие 
порядок матрицы п и минимальное число общих факторов т, ко- 
торое можно извлечь из матрицы порядка п: 


п= 0,5(2т +1+ У8т+ 1), 
т= 0,5(2n+1—V8n+ 1), 
где получаемые п и т округляются до ближайшего целого зна- 
чения. Для п < 15 значения т приведены в табл. 7.12. Принято 
считать, что на практике лучше всегда превзойти минимальный 


порядок матрицы, необходимый для определения данного числа 
факторов. 


(7.21) 


Таблица 7.12 
Значения т для я < 15 


® [3 [5 [в [8 [9 [10 [12 [ 13 [14 [1 
т 12 


5 
5878 |9 [10 


Рассмотренные критерии прекращения факторизации не дают, 
как мы покажем на примере, однозначного решения. Наиболее 
«жестким» является первый (правило двух стандартных откло- 
нений). Наименее «жестким» является критерий Саундерса, он 
позволяет извлечь наибольшее количество факторов. Уравнения 
Терстоуна занимают промежуточное положение и используются 
чаще всего. 

Четвертый этап — «обращение» (преобразование) остаточной 
матрицы, необходимое для выполнения требований (7.18). Суще- 
ствуют разные методы обращения. Один из них приведен в ра- 
боте В. Д. Небылицына*. Мы на дальнейшем примере рассмотрим 


'Небылицым В.Д. Современное состояние факториального внализь // 
Вопросы психологии. 1960, №4. 


более простой (с точки зрения возможных ошибок) аналитический 
метод. Здесь важно отметить, что смысл любого из методов обра- 
щения геометрически сводится к тому, чтобы часть векторов из 
конфигурации остаточной матрицы, имеющих отрицалельные зна- 
чения проекций на ось у + 1-го ортогонального фактора, повер- 
нуть относительно у-го центроида на 180°. Пояснение дается Ha 
рис. 7.4. Очевидно, что в обращенной остаточной матрице для тех 
коэффициентов корреляции, которые соответствуют обращавшим- 
ся векторам, знаки должны быть изменены на противоположные. 
Правила изменения знаков рассмотрим ниже в примере. 


Рис. 7.4. Геометрическая интерпретация обращения остаточной 
матрицы. 
Пунктиром изображены векторы, имеющие отрицательные проек 
ции на ось второго фактора (-Ё?). Сплошной линией (во втором 
квадранте) обозначены те же векторы после обращения. 52 — новый 
центроид, в который будет перенесено начало отсчета после извле- 
чения второго фактора (начало отсчета для геометрической интер- 


претации второй остаточной мытрицы). 


Циклическая процедура факторизации прекращается на 
третьем этапе некоторого у-го цикла, когда проверка показывает, 
что больше факторов извлечь нельзя. В результате получается 
сокращенная матрица факторов, имеющая у столбцов. Для про- 
верки удовлетворительности факторизации необходимо, умножая 
окончательную сокращенную матрицу факторов на ее транспози- 
цию, получить репродуцированную матрицу и, вычитая ее из ис- 
ходной сокращенной корреляционной матрицы, найти остаточную 
матрицу, все элементы которой должны быть близки к нулю. 


Выше указывалось, что сокращенную факторную матрицу мож- 
но рассматривать как одну из возможных реализаций факторной 
структуры, причем не самую лучшую. Чтобы в определенном 
смысле улучшить (упростить) факторную структуру, полученную 
центроидным (или другим) методом, вращают систему координат 
(или отдельные оси) относительно конфигурации векторов. 


1.1.1, Простая латентная структура и ротация 
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Для определения наилучшей позиции системы координат отно- 
сительно конфигурации векторов предложено немало критериев. 
Во-первых, можно руководствовалься тенденцией к согласованию 
результатов ФА с результатами, полученными другими методами. 
Во-вторых, можно стремиться согласовать свои результаты с ре- 
зультатами других исследователей, применявших ФА. В-третьих, 
можно стремиться к получению совокупности факторных зарядов, 
соответствующих каким-то общим положениям данной психологи- 
ческой дисциплины. В-четвертых, можно стремиться к тому, что- 
бы оси соотнесения проходили через центроиды «пучков» корре- 
ляций, если таковые имеются в конфигурации векторов. В-пятых, 
можно руководствоваться принципом «простой структуры», вы- 
двинутым Л. Терстоуном. 

В основе концепции «простой структуры» лежит мысль о том, 
что из нескольких гипотез, одинаково хорошо объясняющих фак- 
ты, следует выбирать наиболее простую, требующую наименьше- 
го числа вспомогательных гипотез. Простота латентной струк- 
туры состоит в том, что каждая переменная имеет относитель- 
но простое факторное содержание, т.е. доминирует заряд одного 
какого-то фактора, и наоборот: «мерой» данного фактора явля- 
ются только некоторые (а не все) переменные из анализируемой 
совокупности. Иными словами, идея простой структуры реали- 
зуется в том, чтобы, вращая оси координат, «расщепить» общие 
факторы до системы групповых. 

Конкретно, стремясь к простой структуре, руководствуются 
следующими положениями: 1) получить наибольшее возможное 
число максимальных по модулю факторных зарядов; 2) получить 
наибольшее число нулевых (близких к нулю, в пределах +0,) фак- 
торных зарядов. Таким образом, максимум для одних факторных 
зарядов и минимум для других — вот критерии «простой структу- 
ры», по которым осуществляется ротация. Нетрудно видеть, что 
критерии противоречивы, и конкретное решение обычно требует 
компромисса. | 

Математический смысл ротации — это поворот ортогональной 
системы координат относительно неизменного начала отсчета на 


некоторый угол ф. При допущении, что факторы облические, ро- 
тации подвергают отдельные оси координат. 

Рассмотрим существо процедуры ортогональной ротации*, ко- 
торую ниже поясним на примере. Ортогональная ротация дву- 
мерной системы сводится к двум этапам. Первый — определение 
угла ф, на который следует повернуть систему координат в плос- 
кости, для того чтобы по возможности удовлетворялись критерии 
«простой структуры» (при вычислениях вручную это проделыва- 
ется геометрически на чертеже). Второй этап — вычисление об- 
щих значений факторных зарядов. 

Геометрически эта задача решается достаточно просто и точно 
следующим образом. На стекло с яркой подсветкой снизу накла- 
дывается начерченная в удобном крупном масштабе на кальке кон- 
фигурация векторов. Прямоугольная система двух координатных 
осей, вычерченная в том же масштабе (длина оси полагается рав- 
ной единице!) на миллиметровой бумаге, накладывается сверху; 
начало координат и начало конфигурации векторов совмещают- 
ся. Далее врашают миллиметровую бумагу, стремясь удовлетво- 
рить требованиям «простой структуры» (или каким-либо другим 
из рассмотренных). Найдя искомое положение осей, по миллиме- 
тровке на осях отмечают новые проекции концов всех векторов 
конфигурации, которые затем определяют (по миллиметровке же) 
в числовом виде. Эти новые проекции и образуют сокращенную 
факторную матрицу после ротации. 

Аналитическая процедура вычисления факторных зарядов по- 
сле поворота системы на угол ф сводится к умножению исходной 
сокращенной факторной матрицы на так называемую матрицу по- 
ворота**. Элементами матрицы поворота являются синусы и ко- 
синусы (с учетом их знаков) из известных формул для новых коор- 
динат при повороте двумерной системы против часовой стрелки: 


2! = 2с08ф + ysing, 

У =-=90 р + усоз фр, 
rae т‚у— старые координаты (г— абсцисса, у- ординала); 
=',У новые координаты; ф— угол поворота против часовой 


стрелки. 
Таким образом, матрица поворота (A) для двух факторных осей 


Облическая ротация сложнее ортогональной He только по процедуре, но 
главным образом по интерпретации получьемых факторных зарядов. 

**П.С.Алексьидров называет эту матрицу «мтрицей преобразования 
координат», что широко, так как понятие преобразования включает в се- 
бя и перенос (А лексьидров П.С. Лекции по аналитической геометрии. 
M., 1968. С.191). 
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(z и у) имеет вид* 
; cosp sing 
-sinp cosy 


3 (7.22) 


Зная ф, элементы матрицы (7.22) легко определить по таблицам 
тригонометрических функций. 

При количестве осей в системе координат более двух элементы 
матрицы поворота вычисляются следующим образом. Сначала 
записывается матрица «нулевого» поворота (Ло) — это единичная 
матрица**, порядок который равен числу факторов (т). Напри- 
мер, для пяти факторов 


10000 
01000 
A=|0 0100 
00010 
oo0o001 


Пусть факторные оси нумеруются слева направо и сверху вниз: 
i = 1,2,3,4,5 и требуется повернуть пару осей i,k (где k = 
1,2,3,4,5, Ho i # k) на угол фу, где }— номер последовательно 
осуществляемых поворотов (j = 1,2,...,(m—1)). Тогда, удаляя из 
матрицы Ло все строки и столбиы, кроме соответствующих осям 
Ти К, получаем подматрицу Ai"), Это тоже единичная матрица: 


i iI: Умножая ее на матрицу поворота осей A (7.22) (от чего A 


не изменится) и дополняя A удаленными ранее из Ло столбцами и 

строками, получаем матрицу ]-го поворота осей i, RAG), 
Например, желая повернуть оси 2 и 4, находим подматрицу 

10 

01 

и, умножая ее на матрицу A, получаем 


ye) 


cosy; sing; 


yay 
a sing; cosy; 


*При повороте на отрицательный угол (по часовой стрелке) матриць по- 
ворота транспонируется: 


*"Элементами матрицы поворота являются так называемые направляю- 
щие косинусы, характеризующие положение системы координат. Для ка- 
жЖдой оси в т-мерной системе этих косинусов т. При нулевом повороте 
(угол повороть 0*) косинус угль со своей осью равен единице, в со всеми 
другими (в прямоугольных координатах) — нулю. 


`Дополняя произведение удаленными ранее строками и столбцами 
матрицы Ло, окончательно получаем матрицу поворота осей 2 и 4: 


1 0 0 0 0 
0 cosy; 0 sing; 0 
= о 1 O О. 
0 -siny; 0 cosy; 0 
ооо 1 


Аналогичным путем получаем матрицу 1-го поворота двух других 
осей, например 3 и 5: 


10 о обо 
7 01 0 0 0 
№39 =|0 0 сор 0 sing 
ооо 
00 -sing; 0 cosy 


Допустим, | = 1+1, т.е. повороты осуществляются последо- 
вательно, сначала 1-Й, а потом [-й. Используя ассоциативность 
‘умножения матриц, можем сразу осуществить оба указанных по- 
ворота. При этом матрица совместного поворота двух пар осей 


определяется умножением слева матрицы 300 на матрицу №. 
1 0 0 0 0 
0 5 0 sings 0 
ye = APP) = 10 0 cosy: 0 singy 
0 —sin g; 0 cose; 0 
0 0 sing! 0 cos $1 


где фу и $! — углы j-ro и 1-го поворотов. Если бы потребовалось 
последовательно осуществить еще один поворот, для которого по- 
лучена матрица А!*, то новая матрица совместного поворота опре- 
делялась бы произведением слева: 


(2,403,50i,k) _ \(2,4A3,8) y (i,k) 
мА = Ам м 


В случае т-мерной системы ортогональная ротация сводится 
к попарному вращению осей; число возможных последовательных 
вращений (т - 1). Важно отметить, что практически при т > 5 
осуществление ротации вручную затруднительно и следует ис- 
пользовать ЭВМ. : 

После ротации вновь осуществляется проверка: умножая фах- 
торную матрицу после ротации на ее транспозицию, определяют 
репродуцированную матрицу и сравнивают ее как с исходной, так 
и с репродуцированной матрицей до ротации. 


1.1.4. Пример мультифакторного анализа с ортогональной ротацией 


„Для иллюстрации мультифакторного анализа рассмотрим кон- 
кретный числовой пример, полученный в реальном исследовании, 
в котором батарея из шести тестов применялась к группе уча- 
щихся профессиональной школы*. В результате попарного корре- 
лирования оценок по тестам (1-Й методический вариант ФА) по- 
лучена сокращенная корреляционная матрица, приведенная в та- 
бл. 7.13 


Таблица 7.15 


Исходная сокращенная матрица корреляций и 
результатывычисления зарядов первого центроидного фактора 


Tlepe- 3 4 5 6 Dyn 

менные 
1 0,400 | 0,297 | 0,116 | 0,232 | 1,744 
2 0,568 | 0,534 | 0,432 | 0,154 | 2,555 
3 0, 568 | 0,487 | 0,436 | 0,071 | 2,530 
4 0, 487 | 0,545 | 0,545 | 0,092] 2,500 
5 0,456 | 0,545 | 0,545 | 0,016 | 2,058 
6 0,071 | 0,092 | 0,016 | 0,232 | 0,765 
Dy 2,530 | 2,500 | 2,058 | 0, 765 = 

= 12,152 

41) 0,726 | 0,717 | 0,590 | 0,219 


VT = 3,486; D>, a3, = 3,485 


Tak как все коэффициенты корреляции в исходной матрице по- 
ложительны, можем непосредственно приступить к вычислению 
первого центроидного фактора. Для этого сначала заполним глав- 
ную диагональ значениями запасов общей изменчивости, в каче- 
стве которых выберем в каждом столбце максимальное значение 
коэффициента корреляции (как это сделано в табл. 7.13). Заря- 
ды первого центроидного фактора, вычисленного согласно урав- 
нению 7.17, a также необходимые для проверки (равенство сумм по 
строкам и столбцам и равенство )), а; & УТ) значения приведены 
тоже в табл. 7.13. 

Умножая матрицу-столбец полученных факторных зарядов на. 
ее транспозицию, определяем первую репродуцированную матри- 
цу, она приведена в табл. 7.14. Вычитая поэлементно первую ре- 


*Звимствован из ки.: Ok dn ап. Analiza ceynnikowaw peychologii. Warszawa, 
1960. 
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продуцированную матрицу из исходной корреляционной матри- 
цы, определяем первую осталочную матрицу, она приведена в 
табл. 7.15. Суммируя по столбцам, убеждаемся в том, что центри- 
рование выполнено безошибочно: суммы на порядок меньше зна- 
чений остаточных коэффициентов корреляции, т.е. практически 
равны нулю. Геометрическая интерпретация полученной осталоч- 
ной матрицы как раз была дана на PHC. 7.3. 


Таблица 7.14 
Первая рспродуцированная матрица 


$ | 6 


0,590 


0,219 


oaeenn|s 


0,110 
0,160 
0,159 
0,157 
0,129 
0,048 


Тоблице 7.15 


Первал остаточная корреляционная матрица 


5 6 
=0,179 | 0,123 
0,000 | —0,006 
0,008 | -0,088 
(0,031) | 0,122 | -0,065 
0,122 | (0,197) | —0,145 
0,065 | —0,145 | (0,185) 
0,003 | 0,003 | 0,004 


Теперь следует убедиться, можно ли продолжать факториза- 
цию. Прежде всего, пользуясь табл. 7.12, устанавливаем, что из 
корреляционной матрицы порядка 6 можно извлечь три общих 
фактора. Однако с целью демонстрации применим также крите- 
рии «стандартного отклонения» и критерий Саундерса. 


Число коррелировавшихся пар N = 133, поэтому oF 


= 
132 

18 #0, 087. Можно видеть, что несколько остаточных коэффици- 
ентов корреляции из табл. 7.15 по модулю превосходят 20, = 0,174. 
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Применим критерий Саундерса. По формулам (7.19) вычисляем 


А= J 4o,213 = 2,4-0,213 0,511, 


5. 
B= (3) ~ 0,694, 


1 2 13,988 _ 
C= 1336 — 2,26)? = = =0,105, 


BC = 0,073 < A=0,511, 


т.е., следуя правилу (7.20), факторизацию надо продолжить. Ho 
для этого необходимо обеспечить выполнение условий (7.18) и пре- 
образоваль первую остаточную матрицу для получения положи- 
тельных сумм по столбцам. 

Наиболее простой алгоритм преобразования (обращения) со- 
стоит в следующем. 

1. Вычисляем алгебраические суммы всех столбцов, не учиты- 
вая запасы общей изменчивости; эти суммы записываем в строке 
5 табл. 7.16. 

2. Заполняем строку —0,55. 

3. В строке —0,55 находим наибольшую положительную величи- 
ну*. Соответствующий этой величине столбец будет обращен в 
первую очередь. Это столбец переменной 5, обозначим его звез- 
дочкой. 

4. Обозначая звездочкой строку переменной 5, складываем ее 
со строкой —0,5S, не учитывая значения 12. Результаты записы- 
ваем в строку +5*. Коэффициент, лежащий на пересечении +5*-Й 
строки и столбца 5°, подчеркиваем прямой линией, слева от этого 
числа проводим вниз прямую линию, как показано в табл. 7.16. 

5. В полученной строке +5* снова находим наибольшее положи- 
тельное значение. Лля соответствующего столбца и строки вы- 
полняем предписание предыдущего пункта 4. В результате полу- 
чаем строку +4* табл. 7.16. 

6. В полученной строке (+4*) снова находим наибольшее поло- 
жительное значение (при этом значения, лежащие в уже обращен- 
ных столбцах, обозначенных прямыми линиями, не учитываются) 
и для него повторяем предписание пункта 4. 

7. Сложение строк, согласно пункту 4, повторяется до тех пор, 
пока в последней строке не получим большинство отрицательных 
величин (не считая уже обращенных столбцов). Эту последнюю 
строку обозначим В. 


“Ошибки не будет, если вместо наибольшей выбрать одну из больших 
положительных величин (см. табл.7.17, строка +3*). 


Таблица 7.16 
Преобразование первой остаточной корреляционной матрицы 


Пере- 1 oP 3° s° 6 
менные | 
1 0,179 (+) (-) (+) (+) 
(0,150) | -0,067 | 0,037 | -0,061 | -0,179 | 0,123 
2 (+) 0,067 (+) 
-0,067 | (0,031) | 0,036 | 0,009 | 0,000 | -0,006 
3° © 0,088 (+) 
0,037 0,036 (0,041) —0, 033 0,008 -0, 088 
4* (+) 0,122 (+) 
—0,061 | 0,009 | —0,033 | (0,031) | 0,122 | -0,065 
5° (+) 0,179 (+) 
-0,179 | 0,000 0,122 (0,197) | -0,145 
6 0,123 (+) (+) (+) 0,145 
—0, 006 —0,065 -0, 145 (0, 185) 
5 -0, 147 -0,028 —0, 028 —0, 194 -0, 181 
-0, 55 0,0735 0,0140 0,0140 0,0970 0,0905 
+5* -0, 1055 | 0,0140 0,0970 | -0,0545 
+4° | -0,1665 || 0,0230 0,1360 || 0,2190 | -0,1195 
+2° —0, 2335 | 70,0230 0,1450 || 0,2190 |-0,1255 
+3* —0,1965 | [0,0590 0,1120 | 0,2270 | -0,2135 


-2в | 0,393 | (-)0,118 | (—)0,062 | (-)0, 224 | (-)0,454 | 0,427 
[2B] +h} | 0,572 0,185 0,150 0,346 0, 633 0,572 


Примечание. 5— суммы по столбиам без запасов общей из- 
менчивости; В — последняя из обращенных строк, она содержит 
накопленные суммы (5). 


8. Удваиваем все элементы строки В и изменяем их знаки на. 
противоположные, Результаты зайисываем в строку —2В. Это 
суммы столбцов после обращения переменных. Отрицательные 
знаки заключаем в скобки, как показано в табл. 7.16. 

9. Вычерчиваем (или заключаем в скобки, как это сделано в та- 
бл, 7.15 и 7.16) остаточные запасы общей изменчивости и над ними 
записываем новые значения, определенные из числа остаточных 
коэффициентов корреляции соответствующих столбцов по методу. 
наивысшей корреляции. 

10. Изменяем алгебраические знаки в матрице остаточных ко- 
эффициентов корреляции в соответствии с преобразованиями: 

— изменяем на противоположные знаки всех коэффициентов в 
преобразованных строках, за исключением лежащих на пересече- 
нии с преобразованными столбцами; 


— изменяем на противоположные знаки всех коэффициентов в 
преобразованных столбцах, за исключением лежащих одновремен- 
но в преобразованных строках. 

В табл. 7.16 измененные знаки записаны сверху в скобках. Зна- 
чения остаточных коэффициентов корреляции с измененными зна- 
ками и новые запасы общей изменчивости образуют преобразо- 
ванную (обращенную) остаточную корреляционную матрицу. 

11. Складывая абсолютные значения |2B|* и новые запасы об- 
щей изменчивости А}, получаем суммы Dj ri) необходимые для 
вычисления зарядов второго фактора по уравнению (7.17). Лля 
проверки правильности вычислений эти же суммы получаем, не- 
посредственно суммируя по столбцам преобразованную остаточ- 
ную корреляционную матрицу. 

Вычислив факторные зарялы, необходимо определить их знаки. 
Для этого имеется общее правило. Знак факторного заряда у-го 
фактора 1-й переменной, которая не была преобразована или была 
преобразована четное число раз, сохраняется таким, каким он был 
для заряда первого фактора этой переменной. Знак факторного 
заряда переменной, преобразованной нечетное число раз, изменя- 
ется на противоположный по сравнению со знаком заряда первого 
фактора**. 

В нашем примере переменные 2-5 были преобразованы нечет- 
ное число (один) раз, а переменные 1 и 6— не преобразованы, 
Поскольку все заряды первого фактора были положительны, за- 
ряды второго фактора у переменных 1 и 6 сохранят положитель- 
ные знаки, а у переменных 2-5 получат отрицательные знаки 
(см. табл. 7.18). 

Дальнейшая процедура факторизации состоит в вычислении 
второй репродуцированной матрицы, которая получается умно- 
жением столбца модулей зарядов второго фактора на его транс- 
позицию (аналогично табл. 7.14). Затем вторая репродуцирован- 
ная матрица вычитается из преобразованной первой остаточной 
‘матрицы, в результате получается вторая остаточная матрица, 
приведенная в табл. 7.17. Она преобразуется точно так же, как 
и первая остаточная матрица. Вычисляя по второй преобразо- 
ванной остаточной матрице факторные заряды третьего фактора 
и применяя правило знаков, получим последний, третий столбец 
сокращенной факторной матрицы (табл. 7.18). Далее, снова умно- 


*Геометрический смысл этих абсолютных значе: 
ванной остаточной матрицы ясен из рис. 7.4. 

**Относительно знака заряда предыдущего (у — 1-го} фактора знак за- 
рядь у-го факторь 1-Й переменной ие изменлется, если переменная не быль 
преобразована, или изменяется на противоположный, если переменная быль 
преобразована на у-м шаге факторизации. 
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Таблача 7.17 
Вторая остаточная матрица корреляций и ее преобразование 


Переменные | 1 2 | = ae! | 5 5* 
(+) (+) 


(-) 


1 0,072 | 0,024 | -0,072 | -0,019 | 0,032 | —0,010 
2 (-) (+) (+) 
0,024 | 0,047 | 0,025 | -0,016 | —0,047 | —0,037 
3 (+) (+) (+) 
-0,072 | 0,025 —0,054 | 0,030 | 0,054 
4 —0,019 (+) (+) (+) 
-0,016 | -0,054 0,033 | -0,015 
5 0,032 (+) (+) (+) 
-0,047 | —0,030 0,047 | -0,002 
6* (+) (+) 
-0,010 | -0,037 | 0,054 0,002 | 0,054 
5 0,045 | -0,051 | -0,077 -0,014 | —0,010 
-0,55 0,0225 | 0,0225 0,0070 | 0,0050 
+3" 0, 0495 || 0,0505_ |] 0,0385 —0,0230 | 0,0590 
+2* -0,0255 | |`0,0505 || 0,0635 -0,0700 | | 0,0220 
4+6°=В |-0,0355 || 0,0135 [10,1175 —0,0720 | [6,0220 
-2B 0,071 | (-)0,027 | (-)0,235 | 0,099 | 0,144 | (—)0,044 


[281+ 0,143 | 0,074 | 0,307 | 0,153 | 0,191 | 0,098 


Примечание. Запасы общей изменчивости (подчеркнуты двз- 
жды) получены по методу наивысшей корреляции. 


Таблица 7.18 
Факторная матрица после вычисления зарядов 
ьторого и третьего факторов 


Переменные 


0,145 
0,075 
0,312 
—0,155 
-0,194 
-0,099 


oasene 


жая столбец модулей зарядов третьего фактора на его транспози- 
цию, получаем третью репродуцированную корреляционную ма- 


трицу, вычитая которую из второй преобразованной остаточной 


матрицы, получаем третью остаточную матрицу, представленную 


в табл. 7.19. 
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Табльца 7.19 
Третья остаточная корреляционная матрица. 

Переменные | 1 |= 
1 0,051 | -0,035 | 0,027 
2 —0, 035 0, 041 6,001 
3 0,027 | 0,001 | -0,025 
4 —0,041 | 0,004| 0,005 
5 
6 


0,004 | 0,032 | 0,030 
—0,004 | -0,044 | 0,023 


Суммы | 0,002| 0,0 | 0,001 | 


Согласно уравнениям Терстоуна (7.21), исходная корреляци- 
онная матрица шести переменных позволяет извлечь только три 
значимых фактора. Прекращая на этом основании факторизацию 
в данном примере, отметим следующее. По правилу двух стан- 
дартных отклонений факторизацию следовало прекратить после 
извлечения второго фактора. Действительно, 2c, = 0,174, как по- 
казано выше, а во второй остаточной корреляционной матрице нет 
ни одного элемента такой абсолютной величины. С другой сто- 
роны, учитывая критерий Саундерса, нам следовало бы пролол- 
жить факторизацию, извлекая четвертый фактор. Действительно, 
пользуясь третьей остаточной и факторной матрицами (табл. 7.18 
и 7.19), вычисляем 


А= o,o1ss = 2,4.0,0168 = 0, 04; 


a 
B= (=) =0,25; 


6 
= 1 (6 ~ 2,96)? 9242 ~ 9, бо, 
C= 7yq(6 - 2,96)? Эта = 0, 069; 


BC = 0,25 - 0,069 = 0,017 < A = 0,04, 


т.е. надо продолжаль факторизацию. Таким образом, уравнения 
Терстоуна на самом деле дают промежуточное значение числа ша- 
гов факторизации. 

Закончив процесс факторизации, необходимо, умножив сокра- 
щенную факторную матрицу (табл. 7.18) на ее транспозицию, 
получить репродуцированную малрицу, сложить ее с последней 
(третьей) остаточной матрицей (табл. 7.19) и результат вычесть 
из исходной корреляционной матрицы (табл. 7.13). Таким путем 
определяется матрица погрешностей, элементы которой не долж- 
ны превышать нескольких тысячных долей, Часто используют 
сокращенный метод проверки, которым мы воспользуемся после 
ротации. 


Осуществим ортогональную ротацию системы соотнесения на- 
шего примера, добиваясь выполнения требований «простой струк- 
туры». 

Прежде всего определим проекции факторной структуры на три 
взаимно перпендикулярные плоскости, в которых лежат пары осей 
РР», ЕВ и ЕЕ». При этом конец вектора каждой переменной 
будет изображен точкой: в плоскости Ри, Е — с координатами 
(a,j, а2;); в плоскости Е», Ез— с координатами (ал; ag); в плоско- 
сти Fy, Ез— с координатами (a);, аз;), где координаты (аз, ак;) — 
это пары зарядов i-ro и k-ro факторов из сокращенной фактор- 
ной матрицы (табл. 7.18). Указанные проекции представлены на 
рис. 7.5. 


Puc. 7.5. Три проекции факторной структуры (согласно 
табл. 7.18). 

«— для факторов Fy и Fa; 6— для Py и Fy; «— для В и Fs. 
Точками обозначены проекции концов векторов соответству- 
ющих переменных. Пунктиром показано положение осей Fy 
и Е, после поворота на угол ф = 45°, удовлетворяющего (в 
первом приближении) требованиям «простой структуры». 


Рассматривая эти проекции, нельзя обнаружить ничего опре- 
деленного в смысле требований «простой структуры» по 'Терсто- 
уну. Но если повернуть систему осей Fi, Fz на угол 45° против 
часовой стрелки (рис. 7.5, а), то можно видеть следующее. За- 
ряды первого фактора у переменных 2-5 сохраняются на высоком 
‘уровне, a заряды этого фактора у переменных 1и 6 приближают- 
ся к нулю. Заряды второго фактора становятся положительны- 


ми и увеличиваются для всех переменных, кроме пятой, у кото- 
рой заряд приближается к нулевому. Таким образом, требования 
«простой структуры» в определенной мере выполняются. Здесь 
необходимо подчеркнуть, что практически эти требования всегда 
выполняются только в приближенной степени. Возможно, что не-` 
сколько лучший результат получился бы при повороте не на 45°, 
а на угол 30°58’: тогда ось Fy проходила бы почти через точку 
5-й переменной, a ось Е; — через точку 6-й переменной, т.е. веса. 
двух факторных зарядов стали бы нулевыми, а веса большинства. 
других еще несколько увеличились бы. Однако невозможно «на 
глазок» определить «наилучший» угол, такой, чтобы требования 
«простой структуры» выполнялись в строго количественном смы- 
сле. Лля этого необходим последовательный процесс вращений с 
поиском двух экстремумов на основе вычисления значений крите- 
риев «простой структуры», что даже в простейшем случае двух 
факторов является сложной задачей, требующей значительного 
числа переборов*. Поэтому мы ограничимся приближением, ко- 
торое достигается поворотом на 45°, достаточным для целей при- 
мера. 


Теперь остается получить числовые значения факторных заря- 
дов по первым двум факторам после ротации (очевидно, что заря- 
ды третьего фактора не изменятся, так как система осей А! и Fp 
вращалась вокруг неподвижной оси Fy). Воспользуемся аналити- 
ческим методом, для чего определим матрицу поворота системы 
осей Ри Fa. 

Матрица нулевого поворота в нашем примере имеет порядок 3. 
Удаляя из матрицы Ло столбец и строку F3 (эта ось не вращается), 
получаем подматрицу 


(1,2) _|1 0 

№ lk 1 
lA № В 
в|тоо 
м= Blo 1 0 
Blo от 


умножая которую Ha матрицу поворота осей A (7.22) и добавляя 
обратно строку и столбец Fs, получаем матрицу первого поворота. 


*Эту задачу успешно может решить ЭВМ. 
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осей F, и Р» с элементами sin 45° = cos 45° = 0,71: 
В 0,71 0,71 0 
x) = |-0,71 0,71 s) 
о от 


Чтобы получить значения факторных зарядов после первой ро- 


тации (поворота), умножаем сокращенную факторную матрицу 
«не вращавшихся» факторов (табл. 7.18, обозначим ее Vo) на ма- 


трицу первого поворота, att), 


0,500 0,365 0,145 
0,733 -0118 0,075 
и зила = {0,726 —0,095 0,312 |. и 9 
r= "ot = = 10,717 -0,220 -—0,155 0 1 is 
0,500 0,404 —0,194 
0,219 0,365 —0,099 
0,096 0,614 0,145 
0,604 0,436 0,075 
_ | 0,582 0,448 0,312 
=| 0,655 0,353 —0,155 |" 
0,705 0,132 —0,194 
—0,104 0,414 —0,099 


где У, — сокращенная факторная матрица после первой ротации, в 
которой столбцы (слева направо) соответствуют факторам Ё!-Ёз, 
а строки (сверху вниз) — переменным 1-6. Проекции факторной 
структуры, соответствующей матрице Vi, приведены на рис. 7.6 
(они получены тем же путем, что и проекции на рис. 7.5). 

Система из трех факторов позволяет выполнить еще одну рота- 
цию, благодаря которой «простая структура» может быть улуч- 
шена. Рассматривая рис. 7.6, 6, можно видеть, что, повернув си- 
стему осей Е; и Fy так, чтобы они проходили через точки 5 и 3, 
мы получили бы два нулевых факторных заряда, а остальные — 
максимально большие и положительные. Для этого нужен поворот 
на угол ф & 54°30’. Мы, однако, для упрощения вычислений в при- 
мере осуществим поворот снова на 45°, как показано на рис. 7.6, 6; 
этого достаточно в первом приближении к «простой структуре». 

Необходимо определить матрицу второго поворота осей Ёз и 
Fs. Пля этого из`матрицы № удаляем строку и столбец оси Fi, 
которая не вращается, и получаем подматрицу 


Рис. 7.6. Три проекции факторной структуры после первой ро- 
тации (согласно матрице V;). 

а— для факторов Е! и Ff; б— для Е; и Fl; з— для Е} м Fl. Точ- 
ки проекции концов векторов переменных. Пунктиром показь- 
но новое положение осей Е; и Е; после поворота на угол + = 45°, в 
первом приближении удовлетворяющего требованиям «простой 
структуры». 


Умножая ее на Л (7.22) и добавляя удаленную строку и столбец F;, 
получасм матрицу второго поворота, элементы которой sin 45° = 


cos 45° = 0,71: 
ко 0 

№29) =10 0,71 в] 

0 -0,71 0,71 


Теперь можно получить значения факторных зарядов после вто- 
рой ротации двумя путями: либо yee), либо Vo( Ab?) (2:9), Bro- 
рой путь приводит к меньшим ошибкам, поэтому определим ма- 
трицу совместного поворота осей 1,2 и 2, 3: 


0,71 от ото о 
Mian?) = 29) = |-0,71 0,71 0]. 0,71 0,71) = 
о Ию -0,71 0,71 
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а затем умножим на нее исходную сокращенную факторную мат- 


рицу 


Ve 


(1A2) 


0,500 
0,733 
0,726 
0,717 
0,590 
0,219 


0,096 
0,604 
0,582 
0,655 
0,705 
—0, 104 


VonS2028) = 


0,365 
—0, 118 
—0, 095 
—0,220 
—0,404 

0, 365 


0,329 
0, 254 
0,095 
0, 358 
0,230 
0, 361 


0,145 
0,075 
0,312 


—0, 155 | 


—0, 194 
—0,099 


0,535 
0, 360 
0,537 
0,138 
—0, 044 
0,221 


где У› — сокращенная факторная матрица после двух ротаций (пе- 
ременные — по строкам, сверху вниз, факторы — по столбцам, сле- 
ва направо). Геометрическая интерпретация факторной структу- 
ры согласно матрице V2 представлена на рис. 7.7. Можно видеть, 
что требования «простой структуры» приблизительно выполня- 


Аи 


А 


Рис.7.7. Три проекции факторной структуры после двух 
ротьций (согльсно матрице V2). 

«— для факторов Е" и F;'; б— для Fy! и Е’'; «— для Е! и Еу. 
Точки — проекции концов векторов переменных. 


Теперь остается проверить результаты вращения. Проверка 
осуществляется следующим образом. Во-первых, необходимо вы- 
числить запасы общей изменчивости по матрице У; и сравнить их 
© полученными по матрице И. Это сделано в табл. 7.20. Мож- 
но видеть, что расхождения незначительны, следовательно, про- 
цесс ротации искажений не внес. Во-вторых, необходимо вычи- 
слить по уравнению (7.5) на основе матрицы И репродуцирован- 
ные коэффициенты корреляции и прибавить к ним соответствую- 
щие элементы из третьей остаточной матрицы (табл. 7.19), а затем 
сравнить с исходными коэффициентами корреляции (табл. 7.13). 
При сокращенном методе проверки, как отмечалось, вычисляют 
не все коэффициенты, а только выборочно — т пар, как показано 
в табл. 7.21. Так как при факторизации векторы некоторых пере- 
менных были подвергнуты обращениям, то это необходимо учесть 
при суммировании остатков ®;. Здесь используется следующее 
правило: если сумма обращений 1-Й и }-Й переменных четная, то 
знак остатка из третьей остаточной матрицы не изменяется; если. 
сумма обращений переменных нечетная, то знак остатка изменя- 
ется на противоположный (см. табл. 7.21). 


Таблица 7.20 


Сравнение запасов общей изменчивости, вычисленных по 
разным матрицам 


3 
% 


Pacxomnenne 
вычисленные | вычисленные 
по Vz по Vp 


1 0,403 0,404 0,001 
2 0,557 0, 556 0,001 
3 0,635 0,633 0,002 
4 0, 589 0,586 0,003 
5 0,552 0,548 0,004 
6 0,188 0,189 0,001 


Вычислительная процедура мультифакторного анализа закан- 
чивается проверкой. Далее необходима содержательная интер- 
претация выявленной латентной структуры, которая (как неодно- 
кратно указывалось) выходит за рамки математической статисти- 
ки. Тем не менее следует обратить внимание психологов, начи- 
нающих применять факторный анализ, что путь для содержатель- 
ной интерпретации факторов — это обобщение смысла переменных, 
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Выборочная проверка исходных коэффициентов корреляции на основе 
матрицы факторов V2 


Таблица 7.21 


¥ Сумма 

а в третьей | обращений >». Исходный ры 
мен- остаточ- переменных rh thi 5 
ных ной мат- ing 
inj рице 

0,000 
1и2 | 0,334 -0,035 Четная (2) - 0,299 0,299 

0,002 
2из | 0,569 0,001 Четная (4) + 0,570 0, 568 

0,003 
Зи4 | 0,495 0,005 Нечетная (3) - 0,490 0,487 

0,002 . 
4и5 | 0,545 0,002 Четная (2) + 0,547 0,545 

0,001 
5иб | 0,000 -0,017 Четная (2) - -0,017 0,016 

0,001 
1иб | 0,227 —0,004 Нечетная (1) + 0,231 0,232 


имеющих высокие нагрузки по факторам. Общий смысл объясня- 
емых переменных отражается в названии факторов (общий, вер- 
бальный и невербальный интеллект; экстра-—интроверсия и ней- 
ротизм; аффектотимия, шизотимия, сила— слабость Я ит. a). В 
свою очередь, латентная структура интерпретируется путем об- 


общения смыслов образующих ее факторов (интеллект, личность 
и др.)*. 


Примеры интерпретации факторной структуры можно найти в работах: 
Теплов Б.М. Простейшие способы факторного анализа // Типологиче. 
ские особенности высшей нервной деятельности человека. Т.У. M., 1967, 
Небылицых В.Д. Современное состояние факториального анализа // Bo- 
просы психологии. 1960. №4; Докторов B.3. Сравнение рьбочих харак 
теристик различных методов факторного анализа при комплексном изуче- 
нии человека // Человек и общество. Вып. ГУ. Л., 1969; Беспалько И.Г. 
О некоторых неясных вопросах психологической интерпретации факторов в 
факторном внализе // Психологический журнал. 1987. №3, 


ПРИЛОЖЕНИЕ |. ПОЛЕЗНЫЕ СВЕДЕНИЯ О МАТРИЦАХ И ДЕЙСТВИЯХ С НИМИ 


Матрицей называется математическая таблица, в виде которой 
записано множество данных. Например, это матрица 


a 2 23 


ni[wlulwelu |» 


ху) = 
1 [алла | виа: | виз | 2122 | азаз | 2129 


Fa ean Peon [ona Газа [ons | 222s 


где качественные характеристики данных обозначены подходящи- 
ми символами (пометками) в головхе и боковике, которые образу- 
ют шапку матрицы, а количественные (числовые, функциональные 
или другие) характеристики размещены в теле матрицы, на пе- 
ресечениях строк и столбцов, так что однозначно соотносятся с 
пометками. 


Матрица А(ХУ2)— это трегмерная помеченная матрица раз- 
мера (2х2х3). Число разных групи событий либо величин, функ- 
ций, других математических объектов определяет мерность (раз- 
мерность) матрицы. Так, матрицы А(А), А(АВ), .--, A(ABC, ..., 
W), которые содержат олну, две, ...,М групп событий, являются 
соответственно одномерной, двумерной, ..., М-мерной матрицами, 
Количество градаций (или значений) в каждой группе событий 
(или величин, функций) определяет размер матрицы по этой груп- 
пе или величине, а все вместе размеры записываются в формулу 
размера: (1хп) — для одномерной матрицы-строки, (п! x п2) — для 
двумерной матрицы, (п: X M2 X °° x пм) — для М-мерной матрицы. 
Эти формулы определяют общее число элементов в теле матрицы. 


В большинстве математических работ по так называемой линей- 
ной алгебре, где с помошью матриц записываются коэффициенты 
системы линейных уравнений, пометки не используются. Вместо 
них только подразумеваются порядковые номера строк и столб- 
цов, отображаемые индексами при элементах матриц. Например, 
такова двумерная неломеченная матрица в виде прямоугольной 
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таблицы размером (п x т): 


Git @12 «+. @т 
А= | 41 22... Gam р 
@nt Gn2 ... nm 
где ay при i= 1,2,...n 4 j = 1,2,...,т— элементы, лежащие на 


пересечении {-Й строки и j-ro столбца. Сокращенная запись: A = 
а; || = {aij}. Можно видеть, что матрица А представляет собой 
тело помеченной матрицы вида А(ХУ), где X = (11,22,...,2.) = 
{zi} 4 Y = (y1,¥2,-.-¥m) = {yj}. Так что непомеченную матри- 
цу можно определить как частный случай помеченной матрицы, у 
которой пометки не записаны в явном виде (т.е. множество поме- 
ток— пустое множество). Очевидно, для психологии, социологии 
и других наук, имеющих дело с множествами сложных объектов, 
непомеченные матрицы представляют ограниченный интерес. 

Одну и ту же матрицу можно записывать многими способами, 
по-разному ориентируя в целом на плоскости, различным образом 
сочетая отображаемые объекты и размещая их пометки в шалке 
матрицы. Все такие способы приводят к эквивалентным «с точ- 
ностью до записи» результатам. В частности, можно условиться 
значения первой (по порядку записи в обозначении матрицы) из 
величин размещать по строкам матрицы, второй — по столбцам, 
‘третьей — по блокам столбцов, а значения четвертой — по блокам 
строк, нумеруя пометки этих значений сверху вниз и слева напра- 
во, как это было сделано в матрице A(XYZ). Можно упростить 
запись, убрав разделяющие линии, кроме пунктира, который раз- 
деляет блоки столбцов (и строк, если надо), для того чтобы об- 
легчить восприятие и понимание структуры данных в матрице. 
Можно сокращенно записать многомерную помеченную матрицу 
в виде элемента с пометками и индексами либо в виде мультим- 
ножества: 


ил фа 3122 222 23 223 
р 

2 [а а 
A(XYZ) = 7 (a Gn р 
22 \42n @221 , 


уз 
= 2(ауь) = {aijeziys ze 


р 
4112 4122 ‚ @113 @123 
р 
4212 @222 5 @из 223 


все это эквивалентные записи одной матрицы. 

Двумерную матрицу с одинаковым количеством строк и столб- 
цов называют квадратной; тогда говорят о порядке матрицы. Ма- 
трица размера nxn есть матрица порядка п. Конечно, корректней 
было бы в этом случае говорить о матрице «порядка п-квадрат». 


Потому что трехмерная матрица с одинаковым числом п строк, п 
столбцов и п блоков столбцов (или строк) является кубической и 
содержит пхпхл = п? элементов в своем теле, а М-мерная матри- 
ца содержит п” элементов и является гиперкубической. Если в ма- 
трице А(ХУ 2) заменить произведения У 2 на новую переменную: 
YZ =O, то из трехмерной матрица превращается в двумерную: 


О: O2 Оз 04 Os 0 
_m(l 2 13 14 15 16 
Axo) = 2 (И 22 23 24 55 a} 


где о; = уузь, г = 1,2,3,4,5,6, j = 1,2 ик = 1,2,3; но в ней теперь 
исходные переменные YZ стали неявными переменными. Заме- 
тим, что при четном N = 2, 4,6,... и одинаковом числе градаций 
ny = ng = --- = пм многомерная матрица оказывается не только 
гиперкубической с числом элементов п^ в теле, но и квадратной 
после преобразования к двумерному виду, путем подстановок, как 
это было сделано с преобразованием А(ХУ2) + А(ХО). 

Показанные выше преобразования представляют собой, так ска- 
зать, качественные действия с матрицами. К числу таких же дей- 
ствий относятся вращения, перестановки, отбрасывание или при- 
писывание строк, столбцов, блоков, задание блочной структуры 
на матрице и сравнение матриц — преобразования, часть которых 
была рассмотрена в разделе 1.2.4 

Вращения матриц можно осуществлять вокруг пяти осей сим- 
метрии — перпендикулярной плоскости матрицы, горизонтальной 
и вертикальной, а также расположенных под углом 45° и 135° от 
горизонталя (отсчитывая углы против часовой стрелки). Малри- 
цы, которые не изменяются в результате вращения вокруг опре- 
деленных осей, называются симметричными (относительно этих 
осей). К примеру, квадратная двумерная матрица из одинако- 
вых элементов пятисимметрихна, а рассмотренные в книге кова- 
риационные и корреляционные матрицы односимметричны, при- 
чем симметричны относительно оси, расположенной под углом 
135° к горизонтали, которая проходит через так называемую глав- 
ную диагональ матрицы. Этот распространенный вид вращения, 
при котором строки и столбцы матрицы меняются местами, на- 
зывают тренспонированием. В частности, если транспонировать 
матрицу-строку, то получится матрица-столбец, и наоборот. За- 
метим, что матрица-строка и матрица-столбец, имеющие величи- 
ну и направление, суть векторы. Поэтому и говорят об одномер- 
ных малрицах (либо блоках многомерных матриц) как о векторах- 
строках размером (1 х т), в которых одна строка и т столбцов, и 
о векторах-столбцах размером (п x 1), в которых п строк и один 
столбец. 
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Перестановки (перестройки) матриц обусловлены различными 
размещениями объектов и обозначающих их пометок в записи ма- 
трицы. Это перестановка рядов: (у1, уз) <> (у2, 41), «выворачива- 
ние наизнанку» блоков пометок: 


a 2 и ve 


и [3 [м [52 aa | 22 [21 | 22 


а также их комбинации между собой и с вращениями. 

Отбрасыванием или приписыванием строк, столбцов, блоков из 
матрицы получают подматрицы либо надматрицы. Например, 
приписывая две новые строки для градаций 21,22 Е Х и рассма- 
тривая прежние и новые строки в сочетании со значениями че- 
твертой переменной ил, w2 Е W, получим из матрицы A(XY Z) че- 
тырехмерную матрицу А(ХУ ZW) размером (2x2x 3x2), записать 
которую может сам читатель. 

В отличие от перестановок при задании блочной структуры ни- 
чего не удаляется и не приписывается, но матрица разделяется на 
части, которые «сосуществуют» в ней и по мере надобности мо- 
гут преобразовывалться по отдельности. Такие части называются 
блоками, и если они записаны в свернутом виде, как элементы но- 
вой матрицы, то она называется блочной матрицей. Обычно на 
матрице можно задаль несколько блочных струхтур. Так, на трех- 
мерной помеченной матрице, рассмотренной выше, можно задать 
три блочные структуры: 


A(XY Z) = (Хил, Хиль... Хузяз)0 


(ХУ г, ХУ, ХУ) 0 Е , 


222 


а перестраивая матрицу, — еще и другие блочные структуры. 

Важную роль в прикладных исследованиях играет сравнение 
матриц. Сравнение осуществляется по всем рассмотренным свой- 
ствам матриц: по мерности, размеру, пометкам и их размещению, 
по элементам, по общей ориентации (горизонтальной, вертикаль- 
ной) сравниваемых матриц, причем сравниваются матрицы и по- 
парно и по группам, если матриц несколько (что характерно, на- 
пример, для экспериментальной психологии). В результате срав- 
нения устанавливаются различие, сходство, тождество и равен- 
ство матриц. 

О двух непомеченных матрицах говорят, что они равны (А = В), 
если они имеют одинаковые формулы размера и если все ац; = bij. 


Для помеченных матриц это неверно: матрицы должны быть 
еще тождественно помечены, причем пометки должны быть 0д- 
нообразно размещены. По этим причинам сравнение помеченных 
матриц предваряется перестройками для придания пометкам од- 
нообразного размещения. На практике следует по возможности 
единообразно размещать пометки в матрицах, — для записи пер- 
вичных результатов измерений, при сводке данных или в других 
целях. Это облегчает сравнение и избавляет от ошибок. В об- 
щем случае сравниваемые тождественные по пометкам матрицы 
не равны, но могут быть стодны по элементам, и тогда надо ис- 
пользоваль какие-либо критерии (в том числе статистические) для 
оценки меры сходства-различия. А если матрицы не тождествен- 
ны по пометкам, то они могут полностью различаться пометка- 
ми или иметь часть одинаковых пометок, причем большую либо 
меньшую; соответственно определяется качественное различие- 
сходство сравниваемых матрици, разумеется, отражаемых матри- 
‘цами объектов исследования. В результате сравнений, уже путем 
количественных преобразований, из исходных матриц можно по- 
лучить новые матрицы. 

Количественные преобразования тоже рассматривались в раз- 
деле 1.2.4 и использовались в других разделах книги. Поэтому 
здесь только систематизируем их и дополним 

Следует различать аддитивные и мультипликаливные действия. 
К аддитивным относятся логическое, прямое, простое сложение и 
обобщение, 

Логическое суммирование (или дизъюнкция, объединение) вы- 
полняется над булевыми матрицами, элементы которых суть нули 
или/и единицы, либо над пометками небулевых матриц. Результа- 
том служит булева матрица, содержащая все различные элементы 
слагаемых, либо множество пометок, которое тоже содержит все 
разные пометки слагаемых; например: 


(ве) =( 111): 
{2,22} 0 {22,23, 24) = {1 22, 23,24}. 


При этом суммирование выполняется по правилам алгебры логи- 
ки (булевой алгебры): 


14+1+.-:+1 
1404. +0 2Ъ 
0+0+.--+1 


0+0+..:+0 =0. 
Прямое спожение можно рассматривать как объединение не- 
булевых матриц, не имеющих одинаковых пометок, при котором, 


Отредактировал и опубликовал на сайте 


однако, слагаемые размещаются на главной диагонали матрицы- 
суммы (ассоциированной матрицы), а внедиагональные блоки оста- 
ются пустыми либо заполняются нулями; например: 


А B с 
А 
op, ! 
A®BEC= | 4B, ! B. 


i | 3C1,5C2,2Cs 


Заметим, что это сложение необходимо при сводке данных разных 
исследователей (либо серий экспериментов), так как становятся 
очевидными пробелы в данных. 

Простое суммирование— известная операция из линейной ал- 
гебры. Оно выполняется для конгрузнтных матриц (совпадающих 
при наложении), тождественных по пометкам; например: 

Ai + Az = (341, 242) + (441, -ЗАз) = (7Ai, Ap). 
Суммирование, как видим, выполняется по правилам обычной ал- 
гебры. При этом имеется частный случай простого суммирова- 
ния — сложение матрицы с числом, которое означает суммирова- 
ние каждого элемента матрицы с этим числом. 

Обобщение матриц можно определить как такое сложное адди- 
тивное действие, при котором пометки слагаемых объединяют- 
ся, одинаковые элементы просто суммируются между собой, раз- 
ные — суммируются с нулями, а на пересечении отсутствующих 
элементов остаются пустые места. Например: 


Ai О 4: О As = 
А: А: Аз А: 
1 2 2 3 A Ay As Aa 
At fan а12 Аз [а22 азз а ват 
= А2 | ал а2з | О Аз | azz agg о. р iss oe | 
As \asi аз2 Aa \ 442 а4з мВ 


Аз | 2аз: 3a32 2азз аза 
Aa \ 442 43 


Сравнивая аддитивные действия, можно увидеть, что из об- 
общения, наложив определенные ограничения, можно в качестве 
частных случаев получить все остальные. 


Мультитликативных действий тоже несколько: декартово, кро- 
некерово, логическое, адамарово, смешанное, скалярное умноже- 
ния матриц и умножение матрицы на скаляр. Большинство из них 
имеет обратные операции — соответствующие деления матриц. 

Декартовы умножение и деление выполняются над пометка- 
ми матриц, как было показано в разделе 1.2.4; в результате по- 
лучаются пометки совмещенных и условных событий (величин, 
функций). Кронекерово, или тензорное, умножение — это разно- 
видность декартова умножения числовых элементов в матрицах- 
сомножителях; например: (211,212) ® (у, 2,3) = (Ри, ФИ, 
из, 2, 21212, 2123). Заметим, что размер матрицы- 
результата равен произведению размеров сомножителей, а их 
мерность не ограничивает применимости тензорного умножения. 

Мерность сомножителей незначима и при логическом умноже- 
нии (конъюнкции, пересечении), но это умножение применяется 
либо для булевых матриц, либо для выделения общей части поме- 
ток сомножителей; при этом используется правило конъюнкции: 

L-4s...+1 
1.1... 

0-1. 
0.0. 


Например, {21,22} П {22,23, 24} = {22}, 


отли тоот_ 
(ea a 391) == 


Адамарово, или поточечное, умножение применяется только для 
конгруэнтных матриц и состоит в алгебраическом перемножении 
элементов с одинаковыми индексами, например: 


{ajje) + {ув} = {arzebise) - 


Широко известное из линейной алгебры умножение матрицы на 
скаляр представляет собой частный случай адамарова умножения 
двух матриц, в одной из которых все элементы состоят из этого 
скаляра: a{bijz} = {а-В;к}. Адамарово умножение вызывает легко 
выполнимые действия — адамарово деление матриц, адамарову й-ю 
степень, в том числе— корень й-й степени из матрицы: 


{aise} {у} = {аук вк}, 
{орк = {ain}, (aise)? = {Ува 


При этом обратная (в смысле адамарова. умножения) числовая ма- 
трица состоит из обратных чисел: 


{ау} = {Мау}, 


=i, 
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так что единичная матрица в этом случае есть матрица из одних 
единиц (или еще нулей— там, где в исходной матрице нулевые 
элементы). 

Смешанное умножение, на котором в книге основаны матрич- 
ные уравнения распределений, представляет собой определенное 
сочетание кронекерова и адамарова умножений, а именно: мож- 
но перемножать и делить помеченные матрицы разного размера 
и мерности, но при этом на матрице большего размера задается 
блочная структура, конгруэнтная элементам матрицы меньшего 
размера, и блоки умножаются (делятся) на элементы как на скаля- 
ры. Из-за возможности нескольких блочных структур на большем 
сомножителе результат смешанного умножения в общем случае 
многозначен. Однако он может быть однозначным, если в блоч- 
ной матрице отображены среди других те же объекты, что ив 
меньшем сомножителе, а это всегда выполняется для системы слу- 
чайных величин, распределения в которой взаимосвязаны матрич- 
ными уравнениями (см. разделы 1.3.1, 3.1.3, 4.1.3, 4.3.1, 5.3.4). 

Последний вид умножения — скалярное умножение матриц — Ha 
самом деле не является чисто мультипликативным действием, хо- 
тя в названии это широко и прочно укоренилось, а представляет 
собой составную, мультипликаливно-аддитивную операцию, при- 
чем в общем и целом некоммутативную, ибо результат зависит 
от порядка сомножителей. В частности, если умножать вектор- 
строку на равнодлинный вектор-столбец, то получится скаляр; на- 
пример: 

-1 
3 


2 
4 


(2-4-1-3) = [2(-1) +4-34 (-1)2+3-4) = 20. 


Отметим, что ковариация определяется как скалярное произведе- 
ние двух векторов, из которых один записан (или подразумевает- 
ся) в виде строки, а второй— в виде столбца. Но если поступить 
наоборот и умножить вектор-столбец размером (п х 1) на вектор- 
строку размером (1 х т), то получится матрица размером (п х т), 
такая же, как если бы использовалось кронекерово умножение; на- 


пример: 

| _ [(-1)2 (-1)4]_ (-2 -4 

(1)е 5= [6% 3:4 | 26 iw): 
Ограничивают использование скалярного умножения необходи- 
мая аддитивность результатов частных произведений, которая 


обычно отсутствует у помеченных матриц, и необходимость пер- 
вому сомножителю иметь столько же столбцов, сколько строк у 


второго сомножителя. Например, можно скалярно перемножить 
слева направо несколько непомеченных матриц, если произведение 
первых двух имеет столько же столбцов, сколько строк у третьего 
сомножителя и т.д., т.е. если, в частности, произведение формул 
размера сомножителей такое: 


(n x m)(m x k)(k xr) = пхЕ(Ехг) = (xr), 


где (n x r)— размер конечного результата. Например: 


2 23 1\_(6 4\(2 3 1\_ 
(3)e (i 2 В 8) CG 2 3)> 
(2x 1)(1 x 2)(2 x 3) = (2 x 2)(2 x 3) = (2х3), 
(6-2+4-4) (6-3+4-2) (6-1+4-3) = GG 26 a 
(9-24+6-4) (9246-2) (9.1+6.3) 42 30 27 
Надо отметить, что скалярное умножение матриц ассопиативно: 
АВС = (АВ)С = А(ВС). Для симметричных матриц всегда воз- 


можно скалярное возведение в {-ю степень, причем оно рекуррент- 
но: Af = A- AP) = А. AP? ит.д. А симметричная матрица по- 
рядка п всегда получается при скалярном умножении матрицы с п 
строками на ее транспозицию, что используется в факторном ана- 
лизе при восстановлении корреляционной матрицы через матрицу 


факторов. 


ПРИЛОЖЕНИЕ {. МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ 


Таблица 1 
Значения стандартной функции распределения F(z) и 
плотности /(=) нормального закона 


= F(z) (=) = F(z) (=) 

-3,0 | 0,00135 0,00443 0,0 0, 50000 0,39804 
-2,9 | 0,00178 0,00595 0,1 0, 53983 0,39695 
-2,8 | 0,00256 0,00792 0,2 0,57926 0,39104 
—2.7 | 0.00347 0,01042 0,3 0,61791 0,38139 
-2,6 | 0,00466 0,01358 0,4 0,6542 0,36827 
-2,5 0,00621 0,01753 0,5 0, 69146 0,35207 
2,4 0, 00520 0, 02239 0,6 0,72575 0,33322 
—2,3 | 0,01072 0, 02833 0,7 0, 75804 0,31225 
-2,2 .0, 01390. 0, 03547 0,8 0, 78814 0, 28969 
-2,1 0, 01786 0,04398 0,9 0,81594 0, 26608 
2,0 | 0,02275 0,05399 1,0 0, 84134 0,24197 
-1,9 | 0,02872 0,06562 1 0, 86433 0, 21785 
-1,8 | 0,03503 0,07895 1,2 0,88493 0, 19419 
-1,7 | 0,04457 0, 09405 1,3 0, 90320 0,17137 
-1,6 | 0,05480 0, 11092 1,4 0, 91924 0, 14973 
-1,5 | 0,06681 0,12952 1,5 0,93319 0, 12952 
—1,4 0, 08076 0, 14973 1,6 0,94520 0, 11092 
-1,3 | 0,09680 0,17137 1,7 0,95543 0,09405 
—12 | 0,1507 0, 19419 1,8 0, 96407 0,07895 
т 0, 13567 0, 21758 1,9 0,97128 0,06562 
0, 15866 0, 24197 2,0 0,97725 0,05399 

0, 18406 0, 26608 2,1 0,98214 0,04398 

0, 21186 0, 28969 2,2 0,38610 0,03547 

0, 24196 0,31225 2,3 0,98928 0,02833 

0,27425 0,3332 2,4 0,99180 0,02239 

0, 30854 0,35207 2,5 0,99379 0,01753 

0,34458 0,36827 2,6 0,99534 0,01358 

0, 38209 0, 38139 2,7 0, 99653 0,01042 

0,42074 0,39104 2,8 0,99744 0,00792 

0, 46017 0, 39695 2,9 0,99813 0, 00595 

0,50000 0, 39894 3,0 0, 998685 0,00443 
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Таблица II 


Значения гамма-функции 
Для z <1иг> 2 значения гамма-функции вычисляются по 
формулам Г(=) = Г(=+1) : ги Г(=) = (2- ПГ(2 - 1). Например: 
Г(0,7) = Г(1,7) : 0,7 = 0,90864 : 0,7 = 1,2981; Г(3,5) = 2,5. Г(2,5) = 
2,5-1,5 -Г(1,5) =2,5-1,5-0,88623 = 3,32336 


T(z) = | Te z | Г@) = | Te) 
1,00000 1,25 | 0,90640 1,50 | 0,88623 1,75 | 0,91906 
0, 97350 1,30 | 0,89747 1,55 | 0, 88887 1,80 | 0,93138 
0, 95135 1,35 | 0,89115 1,60 | 0, 89352 1,85 | 0, 95561 
0,93304 || 1,40 | 0,88726 || 1,65 | 0,90012 || 1,90 | 0,96177 
0,91817 || 1,45 | 0,88566 | 1,70 | 0,90864 |} 1,95 | 0,97988 
0, 90640 1,50 | 0,88623 1,75 | 0, 91906 2,00 | 1,00000 


Таблица Ш 
Значения 2-преобразования Фишера для т. 
(по: Митропольский, 1961) 


Te | zfs] 


0, 0/0, 0000] 0, 0100] 0, 0200] 0, 0300} 0, 6400} 0, 0501}0, 0601 | 0,0701 |0,0802 |0, 0902 

10, 1003] 0, 1105]0, 1206/0, 1308] 0, 1409) 0, 1511/0, 1614/0, 1717 0, 1820] 0, 1923 
0, 2027] 0, 2132|0, 2237] 0, 2342] 0, 24480, 2554] 0, 2661]0, 2769] 0, 2877 |0, 2986 
10, 3095] 0, 3206]0, 3317] 0, 3428] 0, 3541]0, 3654} 0, 3769] 0, 3884) 0, 4001 |0, 4118 
0, 4236] 0, 4356]0, 4477| 0, 4599] 0, 4722|0, 4847 |0, 4973/0, 5101 |0, 5230/0, 5361 
10, 5493] 0, 5627] 0, 5763] 0, 5901 |0, 6042] 0, 6184] 0, 6328] 0, 6475| 0,6625 |0, 6777 
0, 6931 | 0, 7089} 0, 7250] 0, 7414] 0, 7582] 0, 7753] 0, 7928] 0, 8107 0,8291 |0, 8480 
10, 8673] 0, 8872]0, 9076] 0, 9287/0, 9505] 0, 9730]0, 9962] 1, 0203] 1, 0454/1, 0714 
1, 0986] 1, 1270] 1, 1568]1, 1881] 1, 2212] 1, 2562]1, 2933] 1, 3331 1,3758]1, 4219. 
1, 4722] 1, 5275} 1, 5890] 1, 6584] 1, 7380| 1, 8318]1, 9459] 2, 0923] 2, 2976] 2, 6467 


eeroanesen 


Таблица IV 


Значения т.) для =-преобразования Фишера 
(по: Митропольский, 1961) 
Нуль целых и запятая опущены 


— = 
z{] 0 1 2] 3 4 5 в [1 8 9 
0,0 | 0000 | 0100 | 0200 | 0300 | 0400 | 0500 | 0599 | 0699 | 0798 | 0898; 


соочоньъеь-н 
З 
2 


CHARM OKH CEDIA DH EKHE 
© 
8 
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Таблица У 


Критические значения выборочного коэффициента 
линейной корреляции го (по: Урбах, 1964) 
г незначим при т < то=одз и значим при г > Ta=0,01 


п 5% 1% 
4 | 0,950 | 0,990 
5 | 0,878 | 0,959 
6 | 0,811 | 9,917 
7 | 0,754 | 0,874 
8 | 0,707 | 0,834 
9 | 0,666 | 0,798 
10 | 0,632 | 0,765 
11 | 0,602 | 0,735 
12 | 0,576 | 0,708 
13 | 0,553 | 0,684 
14 | 0,532 | 0,661 
15 | 0,514 | 0,641 
16 | 0,497 | 0,623 | 90 | 0,206 | 0,272 
17 | 0,482 | 0,606 |} 100 | 0,196 | 0,258 
18 | 0,468 | 0,590 || 125 | 0,175 | 0,230 
19 | 0,456 | 0,575 | 150 | 0,160 | 0,210 
20 | 0,444 | 0,561 || 200 | 0,138 | 0,182 
21 | 0,433 | 0,549 |] 250 | 0,124 | 0,163 
22 | 0,423 | 0,537 || 300 | 0,113 | 0,148 
23 | 0,413 | 0,526 || 400 | 0,098 | 0,128 
24 | 0,404 | 0,515 || 500 | 0,088 | 0,115 
25 | 0,396 | 0,505 || 1000 | 0,062 | 0,081 
Таблица VI 


Критические значения выборочного коэффициента 
ранговой корреляции ро (по: Урбах, 1964) 
р незначим при р < рожоз и значим при р > ра=о. 


Таблица УП 


Квантили Х?-распределения для доверительной веролтности 
1-а=0,35 и 0,99 
Нулевая гипотеза о сходстве принимается при x? < Ха оь 
и отклоняется при x? > ха от 


v in| se и [9.98 oo [+ 


1 | 3,84 | 6,64 || 31 | 45,0 | 52,2 72 

2 | 5,99 | 9,21 || 32 | 46,2] 53,5 74 

3 | 7,82 | 11,3 || 33 | 47,4 | 54,8 76 

4 | 9,49 | 13,3 || 34 | 48,6 | 56,1 78 

5 | 11,1 | 15,1 || 35 | 49,8] 57,3 | 80 

6 | 12,6 | 16,8 || 36 | 51,0 | 58,6 | 82 

7 | 14,1 | 18,5 | 37 | 52,2 | 59,9 || ва | 106 | ит 
8 | 15,5 | 20,1 || 38 | 53,4 | 61,2 || 86 | 109 | 119 
9 | 16,9 | 21,7 || 39 | 54,6 | 62,4 || 88 | 111 122 
10 | 18,3 | 23,2 || 40 | 55,8 | 63,7 || 90 | 113 | 124 
И | 19,7 | 24,7 || 41 | 56,9 | 65,0 92 | 115 | 126 
12 | 21,0 | 26,2 || 42 | 58,1 | 66,2 94 | 118 | 129 
13 | 22,4 | 27,7 || 43 | 59.3 | 67,5 || 96 | 120 | 131 
14 | 23,7 | 29,1 || 44 | 60,5 | 68,7 || 98 | 122 | 133 
15 | 25,0 | 30,6 || 45 | 61,7] 70,0 || 100 | 124 | 136 
16 | 26,3 | 32,0 | 46 | 62,8 | 71,2 || 110] 135 | 147 
17 | 27,6 | 33,4 || 47 | 64,0 | 72,4 || 120 | 147 | 159 
18 | 28,9 | 34,8 || 48 | 65,2 | 73,7 || 130 | 158 | 170 
19 | 30,1 | 36,2 |] 49 | 66,3 | 74,9 || 140 | 169 | 182 
20 | 31,4 | 37,6 || 50 | 67,5 | 76,2 || 150 | 180 | 193 
21 | 32,7 | 38,9 || 52 | 69,8 | 78,6 || 200 | 234 | 249 
22 | 33,9 | 40,3 || 54 | 72,2 | 81,1 || 250 | 288 | 305 
23 | 35,2 | 41,6 || 56 | 74,5 | 83,5 || 300 | 341 | 360 
24 | 36,4 | 43,0 || 58 | 76,8 | 86,0 || 400 | 448 | 469 
25 | 37,6 | 44,3 || 60 | 79,1 | 88,4 || 500 | 553 | 576 
26 | 38,9 | 45,6 || 62 | 81,4 | 90,8 || 600 | 658 | 683 
27 | 40,1 | 47,0 || 64 | 83,7 | 93,2 || 700 | 763 | 790 
28 | 41,3 | 48,3 || 66 | 86,0 | 95,6 800 | 867 896 
29 | 42,6 | 49,6 || 68 | 88,2 | 98,0 || 900 | 97 | 1002 
30 | 43,8 | 50,9 || 70 | 90,5 | 100 1000 | 1075 | 1107 
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Таблица УШ 


Квантили {-распределения Стьюдента для доверительной 
вероятности 1 — a = 0,95, 0,99 и 0,999 
Нулевая гипотеза о сходстве принимается при ¢ < tano,0s 
и отклоняется при # > ta=0,01 


0,99 0,99 | 0,999 
63,657 2,724 | 3,591 
9,925 2,704 | 3,551 


5,841 | 12,924 2,014 | 2,690 | 3,520 
4,604 | 8,610 2,009 | 2,678 | 3,496 
4,032 | 6,869 | 55 | 2,004 | 2,668 | 3,476 
3,707 5,959 60 | 2,000 2,660 3,460 
3,450 | 5,408 | 65 | 1,997 | 2,654 | 3,447 
3,355 | 5,041 | 70 | 1,994 | 2,648 | 3,435 
3,250 | 4,781 | 75 | 1,992 | 2,643 | 3,426 
3,169 4,587 80 | 1,990 2,639 3,416 
3,106 | 4,437 | 85 | 1,988 | 2,635 | 3,412 
3,054 4,318 90 1,987 2,632 3,402 
3,012 | 4,221 | 95 | 1,985 | 2,629 | 3,396 
2,977 4,140 100 | 1,984 2,626 3,390 
2,947 | 4,073 | 105 | 1,983 | 2,623 | 3,386 
2,921 | 4,015 | 110 | 1,982 | 2,621 | 3,382 
2,898 | 3,965 | 120 | 1,980 | 2,617 | 3,374 
2,878 | 3,922 | 130 | 1,978 | 2,614 | 3,366 
2,861 | 3,883 | 140 | 1,977 | 2,611 | 3,361 
2,845 | 3,850 | 150 | 1,976 | 2,609 | 3,357 


2,831 | 3,819 | 200 | 1,972 | 2,601 | 3,340 
2,819 | 3,792 | 300 | 1,968 | 2,592 | 3,323 
2,807 | 3,768 | 400 | 1,966 | 2,588 | 3,315 
2,797 | 3,745 | 500 | 1,965 | 2,586 | 3,310 
2,787 | 3,725 | 600 | 1,964 | 2,584 | 3,306 
2,779 | 3,707 | 700 | 1,9634 | 2,5829 | 3,304 
2,771 | 3,690 | 800 | 1,9629 | 2,5820 | 3,302 
2,763 | 3,674 | 900 | 1,9626 | 2,5813 | 3,301 
2,756 | 3,659 | 1000 | 1,9623 | 2,5808 | 3,300 
© 


2,750 | 3,646 1,9600 | 2,5758 | 3,291 


Таблица [Xa 


Квантили Р-распределения для доверительной вероятности 1 — a = 0,95 
(по: Митропольский, 1961) 
Нулевая гипотеза о сходстве принимается при 2? < Е? ов; 


и} — число степеней свободы числителя, из — знаменателя 


5 6 8 12 16 24 50 oo 
a 
1 230,2 234,0 238,9 243, 246,5 249,0 251,8 254,3 
2 19,30 | 19,33 | 19,37 | 19,41 | 19,43 | 19,45 | 19,47 | 19,50 
3 9,01 | 8,94 | 8,84] 8,74] 8,69 | 8,64 | 8,58 | 8,53 
4 6,26 | 6.16 | 6,04 | 5.91 | 5,84 | 5,77] 5,70 | 5,63 
5 5,05 | 4,95 | 4,82 | 4,68 | 4,60 | 4,53 | 4,44 | 4,36 
6 4,39 | 4.28 | 4,15 | 4,00 | 3,92 | 3,84 | 3,75 | 3,67 
7 3,97 | 3,87 | 3,73 | 3,57 | 3,4 | 3,41 | 3,32 | 3,23 
8 3,69 8 | 3,44 | 3,28 | 3,20 | 3,12 | 3,03 | 2,93 
9 3,48 7 | 3,23 | 3,07 | 2,98 | 2,90 | 2,80 | 2471 
10 4,96 3,48 | 3,33 2 | 3,07 | 2,91 | 2,82 | 2,74 | 2,64 | 2,54 
п 4,84 3.36 | 3,20 o9 | 2,95 | 2,79 | 2,70 | 2,61 | 2,50 | 2,40 
12 4,75 3,26 | 3,11 00 | 2,85 | 2,69 | 2,60 | 2,50 | 2,40 | 2,30 
13 4,67 3,18 3,02 „92 2,77 2,60 2,51 2,42 2,32 2,21 
а 4,60 зи | 2,96 .85 | 2,70 | 2,53 | 2.44 | 2,35 | 2,24 | 2,13 
15 4,54 3,06 | 2,90 79 | 2,64 | 2,48 | 2,39 | 2,29 | 2,18 | 2,07 
16 4,49 3,01 | 2,85 ,74 | 2,59 | 2,42 | 2,33 | 2,24 | 2,13 | 2,01 
17 4,45 2,96 | 2.81 70 | 2,55 | 2,38 | 2,29 | 2,19 | 2,08 | 1,96 
18 4,41 2,93 | 2,77 66 | 2,5 | 2,34 | 2,25 | 2,15 | 2,04 | 1,92 
19 4,38 2,90 | 2,74 63 | 2,48 | 2,31 | 2,21 | 2,11 | 2,00 | 1,88 
20 4,35 2,87 | 2,71 60 | 2,45 | 2,28 | 2,18 | 2,08 | 1,96 | 1,84 
21 4,32 2,84 | 2,68 57 | 2,42 | 2,25 | 2,15 | 2,05 | 1,93 | 1,81 
22 4,30 2,82 | - 2,66 55 2,40 2,23 2,13 2,03 1,91 1,78 
Окончание табл, 1Ха 
4 5 6 8 12 16 24 50 со 
С 
23 4,28 | 3,42 | 3,03 | 2,80 2,38 | 2,20 | 2,11 | 2,00 | 1,88 | 1,76 
24 4,26 | 3,40 | 3,01 | 2,78 2,36 | 2,18 | 2,09 | 1,98 | 1,86 | 1,73 
25 4,24 | 3,38 | 2,99 | 2,76 2,34 | 2,16 | 2.07 | 1,96 | 1,84 | 1,72 
26 4,22 3,37 2,98 2,74 2,32 2,15 2,05 1,95 1,82 1,69 
27 4,21 3,35 2,96 2,73 2,30 2,13 2,03 1,93 1,80 1,67 
28 4,20 | 3,34 | 2,95 | 2,71 2,29 | 2.12 | 2,02 | 1,91 | 1,78 | 1,65 
29 4,18 | 3,33 | 2,93 | 2,70 2,28 | 2,10 | 2,00 | 1,90 | 1,77 | 1,64 
30 4,17 | 3,32 | 2,92 | 2,69 2,27 | 2,09 | 1,99 | 1,89 | 1,76 | 1,62 
35 4,12 | 3,26 | 2,87 | 2,64 2,22 | 2,04 | 1,94 | 1,83 | 1,70 | 1,57 
40 4,08 | 3,23 | 2,84 | 2,61 2,18 | 2,00 | 1,90 | 1,79 | 1,66 | 1,51 
45 4,06 | 3,21 | 2,81 | 2,58 2,15 | 1,97 | 1,87 | 1,76 | 1,63 | 1,48 
50 4,03 | 3,18 | 2,79 | 2,56 | 2,40 | 2,29 | 2,13 | 1,95 | 1,85 | 1,74 | 1,60 | 1,44 
60 4,00 | 3,15 | 2,76 | 2,52 | 2,37 | 2,25 | 2,10 | 1,92 | 1,81 | 1,70 | 1,56 | 1,39 
70 3,98 | 3,13 | 2,74 | 2,50 | 2,35 | 2,23 | 2,07 | 1,89 | 1,79 | 1,67 | 1,53 | 1,35 
80 3,96 | 3,11 | 2,72 | 2,49 | 2,33 | 2,21 | 2,06 | 1,88 | 1,77 | 1,65 | 1,51 | 1,32 
90 3,95 | 3,10 | 2,71 | 2,47 | 2,32 | 2,20 | 2,04 | 1,86 | 1,76 | 1,64 | 1,49 | 1,30 
100 3,94 | 3,09 | 2,70 | 2,46 | 2.30 | 2,19 | 2,03 | 1,85 | 1,75 | 1,63 | 1,48 | 1,28 
125 3,92 | 3,07 | 2,68 | 2,44 | 2,29 | 2,17 | 2,01 | 1,83 | 1,72 | 1,60 | 1,45 | 1,25 
150 3,90 | 3,06 | 2,66 | 2,43 | 2,27 | 2,16 | 2,00 | 1,82 | 1,71 | 1,59 | 1,44 | 1,22 
200 3,89 3,04 2,65 2,42 2,26 2,14 1,98 1,80 1,69 1,57 1,42 1,19 
300 3,87 3,03 2,64 2,41 2,25 2,13 1,97 1,79 1,68 1,55 1,39 1,15 
400 3,86 3,02 2,63 2,40 2,24 2,12 1,96 1,78 1,67 1, 54 1,38 1,13 
500 3,86 3,01 2,62 2,39 2,23 2,11 1,96 1,77 1,66 1, 54 1,38 1,11 
1000 3,85 | 3,00 | 261 | 2,38 | 2,22 | 2,10 | 1,95 | 1,76 | 1,65 | 1,53 | 1,36 | 1,08 
= 3,84 | 2,99 | 2,60 | 2,37 | 2,21 | 2,09 | 1,94 | 1,75 | 164 | 1,52 | 1,35 | 1,00 


Отредактировал и опубликовал на сайте 


Квантили Е-распределения для доверительной веролтности 1 -а = 


(по: Митропольский, 1961) 
Нулевая гипотеза о сходстве отклоняется при F > Е. =001; 
ип — число степеней свободы числителя, из — знаменателя 


Таблица IX6 


, 99 


1 2 3 4 5 6 8 12 16 24 50 со 

Е 

1 4052 [4909 |5403 [5625 |5764 | 5859 | 5981 | 6106 |6169 | 6234 | 602 6366 

2 98,49 | 99,00 | 99,17 | 99,25 | 99,30 | 99,33 | 99,36 | 99,42 | 99,44 | 99,46 | 99,48 | 99,50 
3 34,12 | 30,81 | 29,46 | 28,71 | 28,24 | 27,91 | 27,49 | 27,05 | 26,83 | 26,60 | 26,35 | 26,12 
4 21,20 | 18,00 | 16,69 | 15,98 | 15,52 | 15,21 | 14,80 | 14,37 | 14,15 | 13,93 | 13,69 | 13,46 
5 16,26 | 13,27 | 12,06 | 11,39 | 10,97 | 10,67 | 10,29 | 9,89 | 9,68 | 9,47 | 9,24 | 9,02 
6 13,74 | 10,92 | 9,78 | 9,15 8,47 | 810 | 7,72 | 7,52 | 7,31 7,09 | 6,88 
7 12,25 | 9,55 | 8,45 | 7,85 7,19 | 6,84 | 6,47 | 6,27 | 6,07 | 5,85 5,65 
8 11,26 | 8,65 | 7,59 | 7,01 6,37 | 6,03 | 5,67 | 5,48 | 5,28 | 5,06 | 4,86 
9 10,56 | 8,02 | 6,99 | 6,42 5,80 | 5,47] 5,11 4,92 | 4,73 | 4,51 4,31 
10 10,04 | 1,56 | 6,55 | 5,99 5,39 | 5,06 | 4,71 4,52 | 4,33 | 4,12 | 3,91 
n 9,65 7,20 | 6,22 | 5,67 5,07 | 4,74 | 4,40 | 4,21 | 4,02 | 3,80 | 3,60 
12 9,33 | 6,93 | 5,95 5,41 4,82 | 4,50 | 4,16] 3,98 | 3,78 | 3,56 3,36 
13 9,07 | 6,70 | 5,74 5,20 4,62 | 4,30 | 3,96 | 3,78 | 3,59 | 3,37 | 3,16 
14 8,86 | 6,51 5,56 | 5,03 4,46 | 4,14 | 3,80 | 3,62 | 3,43 | 3,21 3,00 
15 8,68 | 6,36 | 5,42 4,89 4,32 | 4,00 | 3,67 | 3,48 | 3,29 | 3,07 | 2,87 
16 8,53 | 6,23 | 5,29 | 4,77 4,20 | 3,89 | 3,55 | 3,37 | 3,18 | 2,96 2,75 
17 8,40 | 6,11 5,18 | 4,67 4,10 | 3,79 | 3,45 | 3,27 | 3,08 | 2,86 2,65 
18 8,28 | 6,01 5,09 | 4,58 4,01 3,71 3,37 | 3,20 | 3,00 | 2,79 | 2,57 
19 8,18 | 5,93 | 5,01 4,50 3,94 | 3,63 | 3,30 | 3,12 | 2,92 2,70 2,49 
20 8,10 | 5,85 | 4,94 4,43 3,87 | 3,56 | 3,23 | 3,05 | 2,86 | 2,63 2,42 
a 8,02 | 5,78 | 4,87 | 4,37 3,81 3,51 3,17 | 2,9 | 2,80 | 2,58 2,36 
22 7,94 | 5,72 | 4,82 4,31 3,76 | 3,45 | 3,12 2,94 | 2,75 | 2,53 2,31 


Окончание табл. 1Хб 


2 16 24 50 со 
07 | 2,89 | 2,70 | 2,48 | 2,26 
03 | 2,85 | 2,66 | 2,44 | 2,21 
99 | 2,81 | 2,62 | 2,40 | 2,17 
96 | 2,78 | 2,58 | 2,36 | 2,13 
93 2,74 2,55 2,33 2,10 
90 | 2,71 | 2,52 | 2,30 | 2,06 
87 | 2,68 | 2,49 | 2,27 | 2,03 
84 | 2,66 | 2,47 | 2,24 | 2,01 
74 2,56 2,37 2,13 1,90 
66 | 2,48 | 2,29 | 2,05 | 1,80 
61 | 2,43 | 2,23 | 1,99 | 1,75 
56 | 2,38 | 2,18 | 1,94 | 1,68 
50 | 2,32 | 2,12 | 1,87 | 1,60 
45 | 2,28 | 2,07 | 1,82 | 1,53 
42 | 2,24 | 2,03 | 1,78 | 1,49 
39 2,21 2,00 1,75 1,45 
37 | 2,19 | 1,98 | 1,73 | 1,43 
33 2,15 1,94 1,69 1,37 
31 | 2,13 | 1,92 | 1,66 | 1,33 
28 | 2,09 | 1,88 | 1,62 | 1,28 
24 | 2,06 | 1,85 | 1,59 | 1,22 
23 2,04 1,84 1,57 1,19 
22 2,03 1,83 1,56 1,16 
20 | 2,01 | 1,81 | 1,54 | 1,11 
18 | 1,99 | 1,79 | 1,52 | 1,00 


Таблица Х 


Квантили С-распределения Кохрана 
для доверительных вероятностей 1-а=0,95 
(напечатаны обычным шрифтом) 
и1-а= 0,99 (напечатаны жирным шрифтом) 

Нуль целых и запятая опущены. Нулевая гипотезв о сходстве 
принимается при С < Ganoos м отклоняется при G > Саво 
т— число сравниваемых дисперсий; ь — степеней свободы 


т |3 4 5 6 7 8 9 10 

v 
967 | 906 | 841 | 781 | 727 | 680 | 638 | 602 
993 | 968 | 928 | 883 | 838 | 794 | 754 | 718 
2 871 | 768 | 684 | 616 | 561 | 516 | 478 | 445 
942 | 864 | T8s | 722 | 664 | 615 | 573 | 534 
3 798 | 684 | 598 | 532 | 480 | 438 | 403 | 373 
883 | 781 | 696 | 626 | 568 | 521 | 481 | 447 
4 746 | 629 | 544 | 480 | 431 | 391 | 358 | 331 
834 | 721 | 633 | 564 | 508 | 463 | 425 | 303 
5 тот | 590 | 506 | 445 | 397 | 360 | 329 | 303 
793 | 676 | 588 | 520 | 466 | 423 | 387 | 357 
6 677 | 560 | 478 | 418 | 373 | 336 | 307 | 282 
761 | 641 | 553 | 487 | 435 | 393 | 359 | 331 
7 653 | 536 | 456 | 398 | 354 | 318 | 290 | 267 
734 | 613 | 526 | 461 | 410 | 370 | 338 | 311 
8 633 | 518 | 439 | 382 | 338 | 304 | 277 | 254 
711 | 590 | 504 | 440 | 391 | 352 | 321 | 294 
9 617 | 502 | 424 | 368 | 326 | 293 | 266 | 244 
691 | 570 | 485 | 423 | 375 | 337 | 307 | 281 
10 602 | 488 | 412 | 357 | 315 | 283 | 257 | 235 
674 | 554 | 470 | 408 | 362 | 325 | 295 | 270 
12 580 | 466 | 392 | 339 | 298 | 267 | 244 | 224 
647 | 527 | 445 | 384 | 340 | 305 | 277 | 254 
14 560 | 450 | 377 | 325 | 285 | 256 | 232 | 213 
625 | 503 | 425 | 368 | 322 | 290 | 263 | 240 
16 547 | 437 | 364 | 313 | 277 | 246 | 223 | 203 
606 | 488 | 409 | 353 | 310 | 278 | 251 | 230 
18 536 | 425 | 353 | 305 | 267 | 239 | 217 | 199 
590 | 474 | 397 | 340 | 208 | 269 | 243 | 221 
20 526 | 416 | 335 | 298 | 259 | 230 | 210 | 191 
577 | 461 | 845 | 330 | 289 | 260 | 235 | 215 
25 504 | 397 | 329 | 282 | 245 | 219 | 198 | 180 
550 | 438 | 363 | 312 | 270 | 243 | 219 | 200 
30 490 | 383 | 315 | 270 | 233 | 209 | 190 | 173 
533 | 420 | 349 | 299 | 259 | 230 | 209 | 190 
35 a79 | 372 | 306 | 262 | 227 | 201 | 183 | 216 
518 | 408 | 337 | 288 | 250 | 222 | 200 | 182 
40 469 | 364 | 298 | 255 | 220 | 195 | 177 | 162 
505 | 397 | 327 | 280 | 242 | 215 | 192 | 177 


Отредактировал и опубликовал Ha сайте 


Окончание табл. Х 


Таблица XI 
Допустимые уровни расслоения корреляционной матрицы 
при доверительной вероятности 0,99 
п— число наблюдений; т(0) — значение нулевой чсекущей» плос- 
кости, минимальная значимая абсолютная величина коеффи- 
циента корреляции; |Аг|-— допустимый «шаг» расслоения: 


допустимое число уровней расслоения; +(1),т(2), ...,"(9) — абсо- 
лютные значения секущих плоскостей 


0,976 
0,3100, 492 |0,674|0,856| — 
0,277 |0, 439 0,601 |0,763|0,925| - | - | - | - 


500 

600 0, 256}0, 406 |0, 556 |0,706| 0,856] — - - - 
700 0,237|0,376|0,515 |0,654 0,793] 0,932| - | - | - 
800 10,220] 0, 349| 0,478 |0,607 |0, 736 | 0,865|0,994| - | — 
900 10, 208] 0, 330] 0, 452) 0,574] 0,696]0,818/0,940] - | — 
1000} 0, 197} 0,313} 0, 429] 0,545 [0,661 |0,777|0,893| — | — 
1333| 0, 100] 9]0, 170] 0, 270| 0,370] 0, 470}0, 570] 0, 670] 0, 770 0,870] 0,970 
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